2026.02.25 | 数据工程赋能小模型;轻量重排刷新长文本SOTA
HuggingFace 每日AI论文速递

2026.02.25 | 数据工程赋能小模型;轻量重排刷新长文本SOTA

13分钟 196 3个月前
节目简介
来源:小宇宙

【赞助商】

通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事

传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd

【目录】

本期的 15 篇论文如下:

[00:29] 🖥 On Data Engineering for Scaling LLM Terminal Capabilities(论扩展大型语言模型终端能力的数据工程)

[01:20] 🧠 Query-focused and Memory-aware Reranker for Long Context Processing(面向长文本处理的查询聚焦与记忆感知重排序器)

[02:12] 🔗 From Perception to Action: An Interactive Benchmark for Vision Reasoning(从感知到行动:视觉推理的交互式基准)

[03:04] 🤖 PyVision-RL: Forging Open Agentic Vision Models via RL(PyVision-RL:通过强化学习锻造开放的智能体视觉模型)

[03:52] 📊 LongCLI-Bench: A Preliminary Benchmark and Study for Long-horizon Agentic Programming in Command-Line Interfaces(LongCLI-Bench:命令行界面中长视野智能体编程的初步基准与研究)

[04:41] 🔍 DREAM: Deep Research Evaluation with Agentic Metrics(DREAM:基于智能体指标的深度研究评估)

[05:39] 📈 Conv-FinRe: A Conversational and Longitudinal Benchmark for Utility-Grounded Financial Recommendation(Conv-FinRe:面向效用驱动的金融推荐对话式与长期性基准)

[06:49] ⚙ QuantVLA: Scale-Calibrated Post-Training Quantization for Vision-Language-Action Models(QuantVLA:面向视觉-语言-动作模型的尺度校准后训练量化)

[07:35] 🤖 Learning from Trials and Errors: Reflective Test-Time Planning for Embodied LLMs(从试错中学习:具身大语言模型的反思性测试时规划)

[08:20] 🚀 The Diffusion Duality, Chapter II: $Ψ$-Samplers and Efficient Curriculum(扩散对偶性第二章:Ψ采样器与高效课程学习)

[09:05] 🧩 Communication-Inspired Tokenization for Structured Image Representations(面向结构化图像表征的通信启发式分词方法)

[10:02] 🤖 Aletheia tackles FirstProof autonomously(Aletheia自主攻克首届FirstProof挑战)

[10:42] ⚡ Untied Ulysses: Memory-Efficient Context Parallelism via Headwise Chunking(解绑的尤利西斯:通过注意力头分块实现内存高效上下文并行)

[11:34] ⚡ The Art of Efficient Reasoning: Data, Reward, and Optimization(高效推理的艺术:数据、奖励与优化)

[12:13] 🔒 Adaptive Text Anonymization: Learning Privacy-Utility Trade-offs via Prompt Optimization(自适应文本匿名化:通过提示优化学习隐私与效用的权衡)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递


在小宇宙查看该单集文稿

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧