Album
HuggingFace 每日AI论文速递

2026.02.25 | 数据工程赋能小模型;轻量重排刷新长文本SOTA

13分钟 196 2周前
节目简介
来源:小宇宙
【赞助商】
通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事
传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd
【目录】
本期的 15 篇论文如下:
[00:29] 🖥 On Data Engineering for Scaling LLM Terminal Capabilities(论扩展大型语言模型终端能力的数据工程)
[01:20] 🧠 Query-focused and Memory-aware Reranker for Long Context Processing(面向长文本处理的查询聚焦与记忆感知重排序器)
[02:12] 🔗 From Perception to Action: An Interactive Benchmark for Vision Reasoning(从感知到行动:视觉推理的交互式基准)
[03:04] 🤖 PyVision-RL: Forging Open Agentic Vision Models via RL(PyVision-RL:通过强化学习锻造开放的智能体视觉模型)
[03:52] 📊 LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces(LongCLI-Bench:命令行界面中长视野智能体编程的初步基准与研究)
[04:41] 🔍 DREAM: Deep Research Evaluation with Agentic Metrics(DREAM:基于智能体指标的深度研究评估)
[05:39] 📈 Conv-FinRe: A Conversational and Longitudinal Benchmark for Utility-Grounded Financial Recommendation(Conv-FinRe:面向效用驱动的金融推荐对话式与长期性基准)
[06:49] ⚙ QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models(QuantVLA:面向视觉-语言-动作模型的尺度校准后训练量化)
[07:35] 🤖 Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs(从试错中学习:具身大语言模型的反思性测试时规划)
[08:20] 🚀 The Diffusion Duality, Chapter II: $Ψ$-Samplers and Efficient Curriculum(扩散对偶性第二章:Ψ采样器与高效课程学习)
[09:05] 🧩 Communication-Inspired Tokenization for Structured Image Representations(面向结构化图像表征的通信启发式分词方法)
[10:02] 🤖 Aletheia tackles FirstProof autonomously(Aletheia自主攻克首届FirstProof挑战)
[10:42] ⚡ Untied Ulysses: Memory-Efficient Context Parallelism via Headwise Chunking(解绑的尤利西斯:通过注意力头分块实现内存高效上下文并行)
[11:34] ⚡ The Art of Efficient Reasoning: Data, Reward, and Optimization(高效推理的艺术:数据、奖励与优化)
[12:13] 🔒 Adaptive Text Anonymization: Learning Privacy-Utility Trade-offs via Prompt Optimization(自适应文本匿名化:通过提示优化学习隐私与效用的权衡)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
评价

空空如也

小宇宙热评

暂无小宇宙热门评论

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧