[人人能懂] 从潜在行动、结构化生成到奖励解耦

AI可可AI生活

我们总希望AI更像一个聪明的伙伴,而不是一个笨拙的机器。但怎样才算“聪明”?本期节目,我们将透过几篇最新的研究,一起窥探AI学习智慧的深层秘密。我们会聊到,AI如何像婴儿一样,在无声的世界里自己“悟”出万物的规律;又如何像个特工,在“聊天模式”和“任务模式”间无缝切换;我们还会探讨,如何用一把精妙的尺子,量出AI学到的究竟是“真本事”还是“假把式”,以及如何避免它在多重目标下“偏科”,甚至沦为一个只会讨好规则的“马屁精”。 00:00:39 AI学会了“无师自通”,世界将有什么不同? 00:06:21 给AI装上一个“万能遥控器” 00:12:57 AI上课也分“顿悟”和“补课”?一把尺子量出它学到了多少真本事 00:19:54 AI“偏科”怎么办?谈谈多目标奖励的艺术 00:25:33 “好学生”与“马屁精”,AI如何学会做个人 本期介绍的几篇论文: [LG] Learning Latent Action World Models In The Wild [FAIR at Meta] https://arxiv.org/abs/2601.05230 --- [LG] XGrammar 2: Dynamic and Efficient Structured Generation Engine for Agentic LLMs [Shanghai Jiao Tong University & CMU] https://arxiv.org/abs/2601.04426 --- [LG] Excess Description Length of Learning Generalizable Predictors [UC Berkeley & Anthropic] https://arxiv.org/abs/2601.04728 --- [CL] GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization [NVIDIA] https://arxiv.org/abs/2601.05242 --- [CL] Learning to Simulate Human Dialogue [Stanford University] https://arxiv.org/abs/2601.04436

31分钟
99+
4天前

29. 家电也要长期主义:洗衣机、冰箱、水波炉怎么选|阿健和他的电器

长距离

本期,我们和做家电内容创业的朋友阿健,一起聊聊「家电选购」这件人人都要面对、却最容易被营销词带偏的事。 如果你正在装修、准备换机,或纠结「洗烘一体 vs 分体」「国产 vs 日系」「水波炉值不值」,这期或许会给你一些启发。录制时间在双十一之后,纯经验分享,无广。 Highlights * 「同平台不同价」是真实存在的:同一集团高低端款,核心零部件常常一致,外观/声光电堆料不等于更耐用。 * 洗衣机别盯「炫技词」:自动投放、毛絮过滤、可维护性是真的有用;「AI 洗」「N 种花式程序」大多可忽略。 * 洗烘一体并不差,反而是进化:热泵一体机解决缠绕与烘不干痛点,很多人用过就回不去。 * 冰箱核心不是参数表,而是「收纳与温控」:日系在容积率、抽屉可用空间、温度波动控制上更稳,更能装。 * 制冰是冰箱的「回不去功能」:独立风道制冰不串味,家庭饮品/待客幸福感直线上升。 * 水波炉≠微波炉+烤箱简单叠加:它是「定温加热+蒸汽/热风」的烹饪解决方案,适合忙人和带娃家庭。 * 购买节点别错过:「1 月、3 月、618、双十一」是更容易拿到好价的四个黄金时间。 * 「长期总拥有成本」视角:延保/可清洁结构/耗材供应/能耗,决定 5–10 年的真实成本与舒适度。 * 价值观:做内容也做产品共创——「把用户真正想要的落地」,做更长时间的消费决策。 时间线 * 00:00 为什么家电是「长期主义」之选:从交互设计到做家电内容 * 04:02 行业速描:「白电/黑电」与品牌高端化趋势、渠道变化 * 11:29 同集团高低端「同平台不同价」:外观≠耐用 * 14:14 国产与日系差异:容积率、温控、程序设计的系统思维 * 16:41 线上线下的真实体验与价格机制:返佣、同频 SKU 的利与弊 * 21:39 什么时候买最划算:「1 月、3 月、618、双十一」 * 24:38 水波炉到底特别在哪:定温/蒸汽/自动菜单=忙人解放术 * 29:33 家庭高频场景:面包回温、便当复热、低温加热与蒸点心 * 34:32 「日式灶」带来的烤制效率:几分钟还原酥脆口感 * 37:21 洗衣机如何选:一体 vs 分体、自动投放的正确打开方式 * 44:57 自动投放为什么国产常不好用:基准值/管路/可维护性 * 50:20 毛絮过滤与自清洁:日系的细节设计与节能逻辑 * 54:20 哪些是伪需求?「内衣机」「宠物机」与「AI 洗」 * 59:03 冰箱的「能装」来自哪:抽屉几何、门搁设计、易清洁 * 01:02:47 温度波动与保鲜实测:参数≠体验 * 01:07:49 实用清单:东芝热泵洗烘一体、水波炉、日式灶等 * 01:12:28 价值观与共创:把好产品推向市场的长期主义 * 01:18:27 「长距离」问:什么是你的「长距离」? 互动与留言 如果你有更多和家电相关的问题,欢迎留言或者直接找到@阿健和他的电器。 文字稿 本期完整文字稿可在我们的官网查看。

78分钟
1k+
4天前

2026.01.09 | GDPO解耦奖励优化多任务;可学习乘数解锁矩阵尺度

HuggingFace 每日AI论文速递

本期的 15 篇论文如下: [00:21] 📈 GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization(GDPO:面向多奖励强化学习优化的组奖励解耦归一化策略优化) [01:05] ⚖ Learnable Multipliers: Freeing the Scale of Language Model Matrix Layers(可学习的乘数:释放语言模型矩阵层的尺度) [01:33] 🌙 RL-AWB: Deep Reinforcement Learning for Auto White Balance Correction in Low-Light Night-time Scenes(RL-AWB:基于深度强化学习的低光照夜间场景自动白平衡校正) [02:07] 🤖 RoboVIP: Multi-View Video Generation with Visual Identity Prompting Augments Robot Manipulation(RoboVIP:基于视觉身份提示的多视角视频生成增强机器人操作) [02:56] 🤝 RelayLLM: Efficient Reasoning via Collaborative Decoding(RelayLLM:基于协作解码的高效推理框架) [03:31] 🌲 AT$^2$PO: Agentic Turn-based Policy Optimization via Tree Search(AT²PO:基于树搜索的智能体回合制策略优化) [04:24] 🤔 VideoAuto-R1: Video Auto Reasoning via Thinking Once, Answering Twice(VideoAuto-R1:通过思考一次、回答两次实现视频自动推理) [04:57] 🎬 VerseCrafter: Dynamic Realistic Video World Model with 4D Geometric Control(VerseCrafter:具有4D几何控制的动态逼真视频世界模型) [05:34] 🔍 The Illusion of Specialization: Unveiling the Domain-Invariant "Standing Committee" in Mixture-of-Experts Models(专业化的幻象:揭示混合专家模型中的领域不变“常务委员会”) [06:09] 🎯 Few Tokens Matter: Entropy Guided Attacks on Vision-Language Models(少数令牌至关重要:针对视觉语言模型的熵引导攻击) [06:40] 🎥 Plenoptic Video Generation(全光视频生成) [07:12] ⚖ Agent-as-a-Judge(智能体作为评审者) [07:43] 📄 DocDancer: Towards Agentic Document-Grounded Information Seeking(DocDancer:面向智能体化的文档驱动信息检索) [08:20] 🧠 Re-Align: Structured Reasoning-guided Alignment for In-Context Image Generation and Editing(Re-Align:基于结构化推理引导对齐的上下文图像生成与编辑) [09:05] 🧠 DiffCoT: Diffusion-styled Chain-of-Thought Reasoning in LLMs(DiffCoT:大语言模型中的扩散风格思维链推理) 【关注我们】 您还可以在以下平台找到我们,获得播客内容以外更多信息 小红书: AI速递

10分钟
84
4天前

第486期 告别“野蛮生长”:碳化硅行业迎来价值回归,1000万颗车规芯片背后的生存逻辑

大咖谈芯

芯片行业巨变,价格腰斩、巨头重组,国产碳化硅如何突围?艾诗特科技品牌总监姚培俊亲述:从车规到数据中心,从技术迭代到国产替代,一千万颗芯片背后的生存逻辑是什么? 02:03 碳化硅行业:短期库存压力与长期发展转型并存 04:06 面对行业下行周期,碳化硅芯片厂商的市场策略与定位调整 06:08 碳化硅器件在数据中心和储能系统中的应用前景分析 08:12 碳化硅:数据中心的未来之路,效率、功率密度与成本的挑战 10:12 碳化硅MOSFET技术:助力电动车充电更快、更远,降低成本 12:12 中国新能源车市场的崛起:国产碳化硅品牌的机会与挑战 14:14 碳化硅行业的未来展望:二五年到二十六年的行业趋势和关注点 16:15 碳化硅行业价值回归:挑战与机遇交织的二五年到二六年 18:16 探秘芯片世界,解读电子未来——拆逻辑芯片揭秘播客栏目上线! 2025年,注定是碳化硅产业迈向重构的关键之年。在国际巨头纷纷重组的背景下,从业者的竞争正从器件参数比拼升级为系统价值创造。 本期大咖谈芯邀请到的是深圳爱仕特科技有限公司品牌总监姚培俊先生,面对行业骤然加剧的变化,他们做了怎样的产业调整?如何在动荡的市场环境中探索符合自身定位的可持续发展模式?跟随今天的访谈,拆解本土企业的碳化硅发展蓝图。 合作洽谈添加微信: xinpianjiemi01(添加请备注:粉丝) 发布平台:微信公众号|喜马拉雅|小宇宙|微博|知乎|雪球|搜狐网|网易新闻|bilibili|今日头条|视频号|支付宝|抖音|快手|小红书| 欢迎粉丝们积极在评论区和我们留言互动哦,同时欢迎大家提出你们最想知道的芯片问题,优质提问将有机会得到产业大咖一对一解答!千万别错过~ (Audio downloaded on [Coverr](httpscoverr.co))

18分钟
99+
4天前

Vol.238 英超中期讨论(二):对话凯文丨从阿莫林下课,探究曼联失败的根本原因

足球无双丨可能是全网最主观的足球播客

如何加入足球无双节目粉丝群: 1.在微信上搜索:足球无双(footballmusou)。 2.点击菜单栏上的“加粉丝群”,或者前往最新一期的推送文章下,寻找下方的二维码,扫码即可入群,期待您的加入 主播:老A 嘉宾:凯文 本期节目流程与目录: 节目总时长:约1小时48分 片头曲:Brammer, Darlow & Lowe-Gloria 01:37 阿莫林是否应该从曼联下课?; 04:26 球队在发布会之前或许已经决定解雇阿莫林; 07:49 从阿莫林的话,来解读他最后时刻的心态; 11:24 拉爵的行为是典型的外行领导内行;又菜又爱玩; 12:39 如果拉爵不懂球瞎指挥,那懂球的总监威尔考克斯为什么不说服拉爵,反倒来逼阿莫林呢?; 14:47 既然用四后卫打纽卡赢了,为什么之后就再也不用了?; 18:08 以他如此强的自尊心,最无法接受的就是他的专业性受到质疑; 24:44 阿莫林他到底是manager还是coach?; 31:53 又一次的执教失败,管理层和阿莫林分别担(背)多大的责(锅)?; 46:54 阿莫林有哪些不一样的特质,让他得到了相当数量球迷的支持?; 51:38 如果继续让阿莫林带下去,给他想要的支持,能最终获得成功吗?; 54:51 最近在切尔西也发生了类似的事,管理层干涉教练执教,马雷斯卡因此也离职了,这中间有什么共同之处吗?; 1:00:42 阿莫林下课后,是否会像之前一样,进入又一个轮回?; 1:10:25 主教练被解雇这件事,或许并没有那么特殊; 1:13:36 面对伯恩利的比赛,恢复了四后卫,最终打成了2-2,从这场比赛看出了什么?; 1:23:52 让DNA来出任代理主帅是个好选择吗?; 1:27:32 对于下个赛季的新主帅,更希望谁能来执教?; 1:41:03 这个赛季,球队最终会以什么样的排名收场?; 片尾曲:Kasabian - Fire

108分钟
1k+
4天前

不同意也没办法!聊完新年FLAG,我们决定头也不回地向前跑|EP93

迪谈盖论

人为什么要给自己立那么多FLAG啊!难道真的以为自己可以完成嘛? 可是对于自媒体工作者来说,如果不给自己立一点目标,那真的很容易在“迷雾”中找不到方向。所以,这一期我们俩以一种谈判的方式确定了一些2026年的新年FLAG,而最大的FLAG就是——彼此支持着完成它们。 04:01 对播客更新频率的自我要求;对播客订阅量增长的期望。 12:42 对社交媒体账号的要求和期望:粉丝增长/内容类型/视频长度/数据追踪和投流… 26:25 对于跑步的年度目标?(橙飞老师,有人雄竞!) 31:48 艾迪决定要在26年做的最难的一件事是?盖德为何急到失语? 50:06 对于参加比赛的类型有什么期望? 57:39 对身材管理的目标?为什么艾迪今年越减越肥? 66:14 总结+念评论 --------------------- 在此特别感谢百年专业跑鞋品牌BROOKS布鲁克斯对新年第一期节目的大力支持。 新年伊始,BROOKS布鲁克斯也位跑者带来了升级后的超级甘油2代。它保持了布鲁克斯跑鞋产品一贯的舒适性和稳定性,同时又加强了1代的特色,既厚又韧、缓震超强的中底,能够提供明显的滚动性,让人在愉悦的跑动中不想停下来。 正如此次的传播主题——开跑只向前。这也是一语双关,对应着跑者的肢体动作和心境的成长。2026年,布鲁克斯还将带着更多不断进取的产品,陪伴中国跑者不断向前,完成自我成长的课题。 也希望大家都能在新的一年和过去所有的遗憾好好告别,然后一起头也不回地向前开跑吧! --------------------- 最后,请以下7位朋友(按姓名首字母排序)添加小助手微信“blueshadow2013”提交收件信息,我们会尽快安排礼品的寄送。 为什么本来是选5位但现在是7位呢?因为我又翻出2顶帽子~(其实是有2段没有被念出来的评论我真的割舍不掉) 阿洽在路上 Burgundyredd 陈妈 joyce谈 Mandarin_1 小承碎碎念 星月花生 阿洽在路上: 理由:男女搭配干活不累,节奏很舒服。更重要的是能听到别的地方听不到的内容,有产品经理的专业性,有品牌营销的视角,内容都能引起独立思考,而且略带小幽默。快节奏喜欢看Guide的3分钟帮你决定买不买,慢节奏喜欢看Eddy的vlog,操场绕圈必须搭配迪谈盖论,经常边跑边听边笑。 小承碎碎念: 关注两位就是因为两位的独特魅力,可以从品牌从业人员视角出发来看一些问题,很少能接触到这些角度(常见的是消费者的反馈,品牌的宣传,博主的推广很多时候接收到的是被预制好的观点),艾迪每次赛事活动或者产品宣发都会发现一些细腻的小点,盖德从产品人理性角度分析问题,两位讨论观点看法丰富又有趣,在讨论问题的同时中可以感觉到两位不经意间的爱意,让人很温暖(这可能也是活人感的一部分吧)!!! --------------------- 真心感谢大家的爱,2026年,我们开跑只向前💗

80分钟
1k+
4天前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧