[人人能懂AI前沿] 从推理生成、对齐博弈到共识学习
AI可可AI生活

[人人能懂AI前沿] 从推理生成、对齐博弈到共识学习

30分钟 134 3天前
节目简介
来源:小宇宙
今天,我们将一起探索几篇极具启发性的最新论文。我们将看到,AI如何不再满足于“吃”数据,而是学会“讲道理”,从零推理出知识;我们也会探讨,该如何分辨AI是在“真心思考”还是在“演戏给我们看”。我们还会发现,一个小应用如何拜“云师傅”学到跨界智慧,一个“虚拟宝宝”又如何颠覆我们对双语教育的认知。最后,我们将揭示AI像神枪手一样,通过瞄准“共识”而非“最新目标”来高效学习的秘密。
00:00:37 喂养AI,光有大米还不够
00:06:23 管好AI,我们有了新地图
00:12:13 小应用的大智慧,如何请个“云师傅”?
00:18:03 养“双语娃”,最关键的不是方法,而是……
00:00 AI训练场上的神枪手,如何瞄准一个移动的未来?
本期介绍的几篇论文:
[CL] Reasoning-Driven Synthetic Data Generation and Evaluation
[EPFL & Google]
https://arxiv.org/abs/2603.29791
---
[LG] Aligned, Orthogonal or In-conflict: When can we safely optimize Chain-of-Thought?
[Google DeepMind]
https://arxiv.org/abs/2603.30036
---
[IR] Zero-shot Cross-domain Knowledge Distillation: A Case study on YouTube Music
[Google LLC]
https://arxiv.org/abs/2603.28994
---
[CL] Bringing Up a Bilingual BabyLM: Investigating Multilingual Language Acquisition Using Small-Scale Models
[The Harker School & Stanford University]
https://arxiv.org/abs/2603.29552
---
[LG] Target-Aligned Reinforcement Learning
[Technical University of Munich & Google Research]
https://arxiv.org/abs/2603.29501

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧