跨国串门儿计划 - #493.OpenAI 首席科学家：从自动化研究员到科学发现与AGI 蓝图 - EarsOnMe

主播

节目简介

来源：小宇宙

📝 本期播客简介
本期我们克隆了：Redpoint 旗下的深度访谈播客《Unsupervised Learning》OpenAI’s Chief Scientist on Continual Learning Hype, RL Beyond Code, & Future Alignment Directions
本期嘉宾 Jakub Pachocki 的身份举足轻重——他是 OpenAI 的首席科学家，也是决定这家全球最受关注 AI 公司技术走向的关键人物。在这场深度对话中，Jakub 首次详尽地拆解了 OpenAI 关于“自动化 AI 研究员”的时间表：从 2024 年实现“研究实习生”水平，到 2028 年迈向全自动化。他不仅分享了为什么数学和编程是 AI 进化的“北极星”，还深入探讨了模型如何从简单的“模式匹配”进化到具备真正的科学洞察力。此外，他还揭秘了 OpenAI 为何在 O1 等模型中选择隐藏“思维链”，以及这背后的 AI 安全与可解释性深谋。无论你是开发者、创业者，还是对 AGI 进程感到好奇的观察者，这期节目都将为你提供一份来自 AI 变革最前沿的真实路线图。
👨‍⚕️ 本期嘉宾
Jakub Pachocki，OpenAI 首席科学家。他接替了 Ilya Sutskever 的职位，负责领导 OpenAI 的核心研究工作。他曾是 GPT-4、OpenAI Five（Dota 2 机器人）以及 Codex 等里程碑式项目的关键贡献者。在加入 OpenAI 之前，他拥有哈佛大学计算机科学博士学位，并在算法理论和机器学习领域有着深厚的造诣。
⏱️ 时间戳
00:00 开场 & 播客简介
AGI 的进化时间表
03:56 2024 vs 2028：从“研究实习生”到“全职自动化研究员”
05:19 衡量标准：自主工作的时间跨度与任务描述的模糊度
06:04 编程工具的爆发：Codex 如何改变了 OpenAI 内部的工作流
寻找智能的“北极星”
06:26 为什么是数学：可衡量、易验证且极具挑战的基准
07:37 从 IMO 竞赛到现实世界：模型智能如何转化为经济价值
09:05 跨越领域：RL 强化学习在医疗、法律等非确定性领域的潜力
12:08 开发者建议：不要盲目做 RL，上下文学习（In-context Learning）可能更高效
研究组织的管理与算力哲学
14:35 范式转移：当模型质量成为研究速度的决定性因素
16:31 算力分配心法：宁可放弃“低垂的果实”，也要押注最具扩展性的路径
18:06 独立性：为什么研究部门的优先级要与短期产品策略“脱钩”
20:13 开发者技能的终局：从写代码转向“愿景设定”
AI 助力科学与“模式匹配”之争
23:32 “首次证明”挑战：当模型在一小时内解决博士水平的数学难题
26:05 证伪“模式匹配器”：从 AlphaGo 到科学发现的原创性火花
28:26 未来实验室：AI 科学家与人类研究员的自然协作
安全、对齐与 OpenAI 的进化
30:12 思维链（CoT）监控：为什么隐藏推理过程对 AI 安全至关重要
33:17 避免“训练信号”作对：解耦推理与输出的深层逻辑
35:31 对齐的新希望：研究价值观如何退回到预训练数据
38:06 OpenAI 的四个阶段：从学术实验室到部署通用人工智能
社会影响与未来展望
39:45 调和张力：当理论算法真正开始大规模渗透现实生活
41:06 隐忧：财富集中、治理难题与自动化公司的社会契约
42:32 下一代教育：在 AI 时代，什么才是人类不可替代的自主权
🌟 精彩内容
💡 自动化研究员的“实习期”与“转正期”
Jakub 明确了 OpenAI 对 AI 能力演进的判断标准。他认为“研究实习生”与“全职研究员”的本质区别在于自主性。目前的模型已经能处理具体的技术想法，但未来的目标是让 AI 能在只接收“解决对齐问题”这种模糊指令的情况下，自主运行数天甚至数月并产出成果。
🛠️ 为什么隐藏“思维链”是安全策略？
在 O1 等推理模型中，OpenAI 选择不展示详细的推理过程。Jakub 解释这并非单纯为了防范蒸馏，更核心的是为了“解释性”。如果将思维链作为产品展示，就必须对其进行人类偏好的监督（RLHF），这会干扰模型真实的推理逻辑。保持思维链的“私密空间”，有助于研究员通过监控模型真实的动机来确保长期的安全对齐。
🚀 算力分配的“惨痛教训”
OpenAI 依然是“缩放定律”（Scaling Laws）的坚定信徒。Jakub 提到，在管理海量算力时，他们会强迫自己将大部分资源投入到“最具扩展性”的方法上，即便这意味着要放弃一些短期内能见效、但无法通向 AGI 的优化方案。这种对“未来路径”的极度专注是其保持领先的秘诀。
💻 科学发现不再是“暴力计算”
针对“AI 只是在用暴力破解数学”的批评，Jakub 并不担心。他认为模型已经展现出比人类更短、更优雅的证明路径。他预测未来不会是 AI 完全取代科学家，而是实验室生态的进化——AI 负责设计高质量实验，人类负责设定方向，双方在 STEM 领域开启协作新范式。
❤️ 创始人的紧迫感与社会责任
随着模型在编程和数学上取得突破，Jakub 感到了前所未有的紧迫感。他认为社会必须开始思考：当一个由极少数人组成的“自动化公司”拥有改变世界的力量时，治理结构该如何设计？教育应该如何转向培养“设定方向”的能力而非纯技术技能？
🌐 播客信息补充
本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的
使用 AI 进行翻译，因此可能会有一些地方不通顺；
如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

小宇宙热评

浩_ws9a

2个月前江西

0

讲了半天没啥干活

易陆

2个月前浙江

0

27:05 现在的大语言模型，难道不是模式匹配吗？

#493.OpenAI 首席科学家：从自动化研究员到科学发现与AGI 蓝图

加入我们的 Discord

扫描微信二维码

播放列表