HuggingFace 每日AI论文速递 - 2026.01.29 | 难题优先补数学推理；LingBot生成交互平行世界 - EarsOnMe

主播

拨号上网 1 档播客

节目简介

来源：小宇宙

【赞助商】

通勤路上就听AI每周谈。AI每周谈，每周带你回顾上周AI大事

传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd

【目录】

本期的 13 篇论文如下：

[00:33] 🧠 Harder Is Better: Boosting Mathematical Reasoning via Difficulty-Aware GRPO and Multi-Aspect Question Reformulation（越难越好：通过难度感知GRPO与多角度问题重构提升数学推理能力）

[01:21] 🌍 Advancing Open-source World Models（推进开源世界模型）

[01:55] 🧠 DeepSeek-OCR 2: Visual Causal Flow（DeepSeek-OCR 2：视觉因果流）

[02:58] 🚀 Spark: Strategic Policy-Aware Exploration via Dynamic Branching for Long-Horizon Agentic Learning（Spark：通过关键状态动态分支实现战略策略感知探索的长视野智能体学习）

[03:49] 🔬 Innovator-VL: A Multimodal Large Language Model for Scientific Discovery（创新者-VL：面向科学发现的多模态大语言模型）

[04:34] 🔄 Linear representations in language models can change dramatically over a conversation（语言模型中的线性表征在对话过程中会发生剧烈变化）

[05:26] 🚀 SERA: Soft-Verified Efficient Repository Agents（SERA：软验证高效代码库智能体）

[06:01] 🤖 OmegaUse: Building a General-Purpose GUI Agent for Autonomous Task Execution（OmegaUse：构建用于自主任务执行的通用图形用户界面代理）

[06:46] 🤖 GDCNet: Generative Discrepancy Comparison Network for Multimodal Sarcasm Detection（GDCNet：用于多模态讽刺检测的生成式差异比较网络）

[07:37] 🗣 SE-DiCoW: Self-Enrolled Diarization-Conditioned Whisper（SE-DiCoW：自注册的说话人日志条件化Whisper模型）

[08:27] 📊 RIR-Mega-Speech: A Reverberant Speech Corpus with Comprehensive Acoustic Metadata and Reproducible Evaluation（RIR-Mega-Speech：一个包含全面声学元数据且可复现评估的混响语音语料库）

[09:16] ✏ SketchDynamics: Exploring Free-Form Sketches for Dynamic Intent Expression in Animation Generation（SketchDynamics：探索自由手绘草图在动画生成中的动态意图表达）

[10:07] 🚀 UPLiFT: Efficient Pixel-Dense Feature Upsampling with Local Attenders（UPLiFT：利用局部注意力机制实现高效像素密集特征上采样）

【关注我们】

您还可以在以下平台找到我们，获得播客内容以外更多信息

小红书: AI速递

在小宇宙查看该单集文稿

2026.01.29 | 难题优先补数学推理；LingBot生成交互平行世界

加入我们的 Discord

扫描微信二维码

播放列表