主播
节目简介
来源:小宇宙
【赞助商】
通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事
传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd
【目录】
本期的 5 篇论文如下:
[00:39] TOP1(🔥491) | 🧠 A Very Big Video Reasoning Suite(一个超大规模视频推理套件)
[02:33] TOP2(🔥246) | 💭 Does Your Reasoning Model Implicitly Know When to Stop Thinking?(你的推理模型是否隐含地知道何时停止思考?)
[04:48] TOP3(🔥215) | ⚖ VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training(VESPO:用于稳定离策略LLM训练的变分序列级软策略优化)
[07:29] TOP4(🔥187) | 🌍 The Trinity of Consistency as a Defining Principle for General World Models(一致性三位一体:作为通用世界模型定义原则)
[09:43] TOP5(🔥146) | 🔍 From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models(从盲点到增益:诊断驱动的迭代训练用于大型多模态模型)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事
传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd
【目录】
本期的 5 篇论文如下:
[00:39] TOP1(🔥491) | 🧠 A Very Big Video Reasoning Suite(一个超大规模视频推理套件)
[02:33] TOP2(🔥246) | 💭 Does Your Reasoning Model Implicitly Know When to Stop Thinking?(你的推理模型是否隐含地知道何时停止思考?)
[04:48] TOP3(🔥215) | ⚖ VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training(VESPO:用于稳定离策略LLM训练的变分序列级软策略优化)
[07:29] TOP4(🔥187) | 🌍 The Trinity of Consistency as a Defining Principle for General World Models(一致性三位一体:作为通用世界模型定义原则)
[09:43] TOP5(🔥146) | 🔍 From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models(从盲点到增益:诊断驱动的迭代训练用于大型多模态模型)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
评价
空空如也
小宇宙热评
暂无小宇宙热门评论