时长:
28分钟
播放:
195
发布:
1周前
主播...
简介...
我们总希望AI不只是个聪明的工具,更像个能沟通、能反思、甚至能自我进化的伙伴。本期节目,我们就从几篇最新论文出发,看看科学家们是如何脑洞大开地教AI“忏悔”错误、在虚拟世界里“动手”实践、像团队一样“合成”智慧,甚至上演一出匪夷所思的“灵魂互换”大戏。准备好了吗?让我们一起探索,如何把AI从一个“黑箱”变成一个我们可以理解和塑造的智能体。
00:00:33 让AI“忏悔”,我们能得到什么?
00:05:49 当AI不再只是个“书呆子”
00:11:06 AI自己不行的事,怎么让一群AI办成?
00:16:56 AI的“复盘”教练:如何用人话把它教聪明
00:22:11 AI变形记:为什么你训练的和最后用的,不必是同一个模型?
本期介绍的几篇论文:
[CL] Training LLMs for Honesty via Confessions
[OpenAI]
https://cdn.openai.com/pdf/6216f8bc-187b-4bbb-8932-ba7c40c5553d/confessions_paper.pdf
---
[AI] SIMA 2: A Generalist Embodied Agent for Virtual Worlds
[Google DeepMind]
https://arxiv.org/abs/2512.04797
---
[AI] Algorithmic Thinking Theory
[Google & NYU]
https://arxiv.org/abs/2512.04923
---
[LG] Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space
[UC Berkeley & ByteDance Seed]
https://arxiv.org/abs/2512.04601
---
[LG] Network of Theseus (like the ship)
[MIT CSAIL & Johns Hopkins University]
https://arxiv.org/abs/2512.04198
00:00:33 让AI“忏悔”,我们能得到什么?
00:05:49 当AI不再只是个“书呆子”
00:11:06 AI自己不行的事,怎么让一群AI办成?
00:16:56 AI的“复盘”教练:如何用人话把它教聪明
00:22:11 AI变形记:为什么你训练的和最后用的,不必是同一个模型?
本期介绍的几篇论文:
[CL] Training LLMs for Honesty via Confessions
[OpenAI]
https://cdn.openai.com/pdf/6216f8bc-187b-4bbb-8932-ba7c40c5553d/confessions_paper.pdf
---
[AI] SIMA 2: A Generalist Embodied Agent for Virtual Worlds
[Google DeepMind]
https://arxiv.org/abs/2512.04797
---
[AI] Algorithmic Thinking Theory
[Google & NYU]
https://arxiv.org/abs/2512.04923
---
[LG] Natural Language Actor-Critic: Scalable Off-Policy Learning in Language Space
[UC Berkeley & ByteDance Seed]
https://arxiv.org/abs/2512.04601
---
[LG] Network of Theseus (like the ship)
[MIT CSAIL & Johns Hopkins University]
https://arxiv.org/abs/2512.04198
评价...
空空如也
小宇宙热门评论...
ovesellestte
1周前
荷兰
0
04:26 【奖励对ai的意义是什么】
ovesellestte
1周前
荷兰
0
04:26 【奖励对ai的意义是什么】