Album
AI可可AI生活

[人人能懂] 从内在规划、信念压缩到诚实度的养成

30分钟 178 2个月前
节目简介
来源:小宇宙
今天,我们要深入AI的“内心世界”,去探寻几个颠覆性的问题:聪明的AI,是该学会“胸有成竹”的规划,还是“选择性失忆”的智慧?我们该如何教会一个AI坦然承认“我不知道”,甚至让它比“学霸”更可靠?最新几篇论文,将带我们从AI的“顿悟”规律和推理模式中,找到这些问题的答案。
00:00:28 AI的“顿悟”,它如何学会把“走一步看一步”变成“胸有成竹”?
00:06:42 为什么说,聪明的AI要学会“选择性失忆”?
00:13:03 AI为什么总在“卡关”和“顿悟”之间横跳?
00:19:26 如何让一个“学渣”AI,比“学霸”更靠谱?
00:25:26 从终点出发,如何让AI学会“开窍”
本期介绍的几篇论文:
[LG] Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning
[Google]
https://arxiv.org/abs/2512.20605
---
[CL] ABBEL: LLM Agents Acting through Belief Bottlenecks Expressed in Language
[UC Berkeley]
https://arxiv.org/abs/2512.20111
---
[LG] Saddle-to-Saddle Dynamics Explains A Simplicity Bias Across Neural Network Architectures
[University College London]
https://arxiv.org/abs/2512.20607
---
[LG] Mitigating LLM Hallucination via Behaviorally Calibrated Reinforcement Learning
[ByteDance Seed]
https://arxiv.org/abs/2512.19920
---
[LG] Learning to Reason in LLMs by Expectation Maximization
[Adobe Research & KAIST]
https://arxiv.org/abs/2512.20169
评价

空空如也

小宇宙热评
049_pXgR
2个月前 陕西
1
非常好👍👍,

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧