2026.01.19 | GRPO回报纠偏助啃难题;毒苹果AI未用已扰市
HuggingFace 每日AI论文速递

2026.01.19 | GRPO回报纠偏助啃难题;毒苹果AI未用已扰市

14分钟 166 5个月前
节目简介
来源:小宇宙

【赞助商】

通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事

传送门 🔗 https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd

【目录】

本期的 15 篇论文如下:

[00:33] ⚖ Your Group-Relative Advantage Is Biased(你的组相对优势存在偏差)

[01:20] 🍎 The Poisoned Apple Effect: Strategic Manipulation of Mediated Markets via Technology Expansion of AI Agents(毒苹果效应:通过AI代理技术扩展对中介市场的战略性操纵)

[02:08] 🛠 Unlocking Implicit Experience: Synthesizing Tool-Use Trajectories from Text(解锁隐性经验:从文本合成工具使用轨迹)

[03:14] 📊 RubricHub: A Comprehensive and Highly Discriminative Rubric Dataset via Automated Coarse-to-Fine Generation(RubricHub:通过自动化粗到细生成构建的全面且高区分度的评分标准数据集)

[04:20] 🤔 When Personalization Misleads: Understanding and Mitigating Hallucinations in Personalized LLMs(当个性化误导时:理解并缓解个性化大语言模型中的幻觉现象)

[05:18] 🤖 ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models(ACoT-VLA:面向视觉-语言-动作模型的动作思维链)

[06:07] 🚧 BAPO: Boundary-Aware Policy Optimization for Reliable Agentic Search(BAPO:面向可靠智能搜索的边界感知策略优化)

[07:04] 🎯 ProFit: Leveraging High-Value Signals in SFT via Probability-Guided Token Selection(ProFit:通过概率引导的令牌选择在SFT中利用高价值信号)

[08:01] 🤖 FrankenMotion: Part-level Human Motion Generation and Composition(FrankenMotion:部件级人体运动生成与组合)

[08:54] 🧠 Reasoning Models Generate Societies of Thought(推理模型生成思想社会)

[09:40] 🤖 PersonalAlign: Hierarchical Implicit Intent Alignment for Personalized GUI Agent with Long-Term User-Centric Records(PersonalAlign:基于长期用户中心化记录的个性化GUI代理的层次化隐式意图对齐)

[10:27] 🔍 Building Production-Ready Probes For Gemini(构建适用于Gemini的生产级探针)

[11:21] ⚙ PhysRVG: Physics-Aware Unified Reinforcement Learning for Video Generative Models(PhysRVG:基于物理感知统一强化学习的视频生成模型)

[12:31] 🧊 ShapeR: Robust Conditional 3D Shape Generation from Casual Captures(ShapeR:从随意拍摄中实现鲁棒的条件式3D形状生成)

[13:24] 🚀 AstroReason-Bench: Evaluating Unified Agentic Planning across Heterogeneous Space Planning Problems(AstroReason-Bench:评估异构空间规划问题中的统一智能体规划能力)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递


在小宇宙查看该单集文稿

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧