[人人能懂AI前沿] 更聪明的AI:从精准辅导、内心独白到自我陪练
AI可可AI生活

[人人能懂AI前沿] 更聪明的AI:从精准辅导、内心独白到自我陪练

29分钟 227 5天前
节目简介
来源:小宇宙
你有没有想过,我们到底该如何培养一个更聪明的AI?本期节目,我们将一起揭秘几篇最新论文,看看科学家们是如何给AI请“精准家教”,让它花十分之一的钱办成同样的事;如何窥探AI的“内心戏”,了解它什么时候是真的自信;又是如何通过一个关键的“中间态”和不知疲倦的“AI陪练”,把它从偏科生打造成全能高手,并最终教会它“懂分寸”,成为一名好裁判的。让我们一同探寻AI的成长之道。
00:00:35 AI的“补习班”,如何花十分之一的钱,办成同样的事?
00:06:21 AI的“内心戏”,它怎么知道自己懂不懂?
00:12:18 你和高手的差距,可能只是一个“中间态”
00:18:32 AI的“陪练”,高手是怎么喂出来的?
00:24:11 如何把一个“耿直”的AI,训练得“懂分寸”?
本期介绍的几篇论文:
[LG] Efficient Exploration at Scale
[Google DeepMind]
https://arxiv.org/abs/2603.17378
---
[CL] How do LLMs Compute Verbal Confidence
[Google DeepMind]
https://arxiv.org/abs/2603.17839
---
[LG] PRISM: Demystifying Retention and Interaction in Mid-Training
[IBM Research]
https://arxiv.org/abs/2603.17074
---
[AI] AI Scientist via Synthetic Task Scaling
[Princeton University & Microsoft Research]
https://arxiv.org/abs/2603.17216
---
[LG] REAL: Regression-Aware Reinforcement Learning for LLM-as-a-Judge
[University of California, Los Angeles & The University of Texas at Austin]
https://arxiv.org/abs/2603.17145
评价

空空如也

小宇宙热评

暂无小宇宙热门评论

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧