跨国串门儿计划 - 节目列表

#380.揭秘 Manus:从“对话”到“行动”,构建通用 AI 智能体的未来工作流

#380.揭秘 Manus:从“对话”到“行动”,构建通用 AI 智能体的未来工作流

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:AI Engineer Workshop - Building Intelligent Research Agents with Manus Manus 到底是什么?它被定义为一个“行动引擎”(Action Engine)。在本期节目中,Manus 团队成员 Ivan Leo 将带我们深入技术前沿,展示 AI 智能体如何不再仅仅停留于“给出答案”,而是像真人一样在各种应用中执行复杂的自动化任务。 你将听到 Ivan 现场演示如何利用 Manus API 在几分钟内构建出功能强大的 Slack 机器人、网页应用,并处理复杂的企业报销流程。从法语学习助手到自动抓取 70+ 活动信息的“粗野主义”网站,Manus 展示了其作为通用 Agent 的恐怖实力。无论你是开发者、产品经理,还是对 AI 自动化感兴趣的极客,这期节目都将为你打开 AI 智能体应用的新大门。 👨‍⚕️ 本期嘉宾 Ivan Leo,Manus 团队成员(现 Meta Superintelligence 成员)。他是一位资深的 AI 工程师,致力于构建能够自主执行任务的通用智能体。在本次工作坊中,他通过现场编码和深度 Demo,揭示了 Manus API 的核心能力与设计哲学。 ⏱️ 时间戳 00:00 开场:欢迎来到跨国串门计划 什么是“行动引擎”? 01:57 重新定义 Manus:不只是聊天,更是执行任务的“行动引擎” 03:13 设计理念:到用户所在的地方去(Slack, Email, Browser, Office 365) 04:21 Demo 1:法语学习助手——AI 如何通过交互构建你的个人画像 07:05 Demo 2:浏览器操作器——让 AI 在你的本地浏览器里“跑腿” 08:34 Demo 3:从抓取到建站——几分钟内生成一个功能完备的 Web 应用 10:12 开发者福利:支持 Docker 镜像、Stripe 集成与 Redis 队列 Manus API 实战教学 11:50 API 入门:沙盒环境、计费逻辑与任务 ID 管理 15:12 异步生命周期:如何通过轮询(Polling)监控任务状态 19:30 文件与上下文:支持 PDF OCR、Base64 图片及 48 小时自动删除机制 25:07 进阶玩法:为什么 Webhook 是大规模构建 Agent 的最佳实践 构建一个“有手有脚”的 Slack 机器人 29:26 实战演示:利用 Modal 快速部署 Slack 机器人端点 33:52 多轮对话逻辑:如何利用 KV 存储实现线程记忆 44:41 复杂流处理:AI 如何识别发票、查询 Notion 政策并完成自动化报销 48:16 总结:把杂事交给 Manus,你只需关注核心业务逻辑 深度问答与未来展望 49:04 入门建议:先玩转网页版,再探索 API 沙盒 49:55 幕后故事:那个“粗野主义”风格网站是怎么迭代出来的? 51:47 隐私与安全:数据存在哪?谁能看到我的聊天记录? 52:33 趣味用例:用 Manus 抢订新加坡竞争最激烈的匹克球场 53:21 路线图:浏览器 API 授权、PPT 导出与长效记忆功能 🌟 精彩内容 💡 Manus:从对话到执行的跨越 Ivan 强调,Manus 的核心竞争力在于其“通用性”。它不是一个垂直领域的工具,而是一个自带沙盒环境、能写代码、能操作浏览器的通用 Agent。 “如果你构建的是一个通用的 AI agent,而不是垂直领域的产品,你能做的事情会多得多。” 🛠️ 开发者友好的 API 设计 Manus API 提供了与网页版完全一致的能力。通过提供独立的 Docker 镜像环境,开发者可以在上面安装任何库(如 Redis, BullMQ),这使得构建一个复杂的 MVP(最小可行产品)变得前所未有的简单。 🚀 现场演示:自动报销机器人 最令人惊叹的演示是,Ivan 展示了一个 Slack 机器人如何接收一张贝果店的收据图片,通过 OCR 提取金额,然后自主去 Notion 查询公司的报销政策,最后更新报销表格。整个过程无需人工干预,展示了 AI Agent 处理模糊任务的能力。 🔐 隐私与数据安全 针对开发者最关心的隐私问题,Ivan 明确表示:数据存储在美国,团队不会主动读取用户记录。只有在用户主动分享报错信息时,工程师才会介入调试。此外,API 上传的文件会在 48 小时内自动删除。 📈 未来路线图:记忆与多端对齐 Manus 正在开发“长效记忆”功能,让 Agent 能够记住用户的偏好。同时,很快用户就能通过 API 获得与 UI 界面一致的体验,例如直接导出 AI 生成的 PPT 或 PDF 报告。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

58分钟
2k+
5个月前
#379.数学、悖论与无穷的本质:Math Overflow 传奇哈姆金斯的数学多元宇宙

#379.数学、悖论与无穷的本质:Math Overflow 传奇哈姆金斯的数学多元宇宙

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:全球顶尖访谈播客《Lex Fridman Podcast》Infinity, Paradoxes, Gödel Incompleteness & the Mathematical Multiverse | Lex Fridman 数学是真理的终极语言,还是人类构建的一场华丽游戏?本期嘉宾乔尔·大卫·哈姆金斯(Joel David Hamkins)的成就堪称传奇——他不仅是集合论与无穷本质研究领域的顶尖学者,更是数学界著名社区 Math Overflow 历史排名第一的“大神”。 在这场深度对谈中,哈姆金斯将带我们走入那个让康托尔发疯、让希尔伯特痴迷的“无穷天堂”。我们将从能够塞进无限客人的“希尔伯特旅馆”聊起,揭开实数不可数背后的对角线秘辛;探讨罗素悖论如何差点毁掉数学大厦,以及哥德尔如何用不完备性定理揭示了真理与证明之间永恒的鸿沟。更令人震撼的是,哈姆金斯提出了一种颠覆性的哲学视角:相比于捉摸不透的物理世界,抽象的数学世界反而更加清晰真实。这是一场关于逻辑、真理与现实本质的头脑风暴,它将彻底重塑你对这个世界底层逻辑的认知。 👨‍⚕️ 本期嘉宾 乔尔·大卫·哈姆金斯(Joel David Hamkins),圣母大学数学与哲学教授。他是集合论、逻辑学和数学哲学领域的权威专家,著有《证明与数学的艺术》、《数学哲学讲座》等著作。他在 Math Overflow 社区拥有历史第一的声望值,以其对复杂数学概念极具洞察力且优雅的解释而闻名。 ⏱️ 时间戳 00:00 开场 & 播客简介 无穷的诱惑与危机 05:11 康托尔的遗产:为什么有些无穷比另一些更大? 11:24 希尔伯特旅馆:如何在一个住满客人的旅馆里再塞进无穷个人 15:03 希尔伯特公交车与火车:无穷多个无穷相加的奇妙结果 22:33 实数的不可数性:康托尔如何用对角线论证打破直觉 数学大厦的根基 34:47 集合论的崛起:作为所有数学学科的统一基础 48:08 罗素悖论:那个“不包含自身的集合”如何引发了数学内战 52:47 拟人化思维:用“委员会”和“水果沙拉”理解深奥的集合论 58:43 逻辑主义的梦想:弗雷格的心碎与 ZFC 公理系统的诞生 逻辑的极限与真理 59:52 希尔伯特纲领:试图证明数学永远不会出错的宏伟计划 01:12:07 哥德尔不完备性定理:为什么数学中总有无法证明的真理 01:17:11 塔斯基的真理观:句子“雪是白的”是真的,当且仅当雪是白的 01:26:16 停机问题:图灵如何证明有些事情是计算机永远无法预知的 数学哲学与现实本质 01:41:06 抽象vs物理:为什么数学对象比物理对象更真实、更清晰 01:46:30 结构主义视角:尤利乌斯·凯撒到底是不是一个数字? 02:15:05 连续统假设:那个让康托尔崩溃的难题到底在问什么 02:25:21 集合论多元宇宙:不存在唯一的数学真理,只有不同的宇宙 数字的奇幻游戏 02:36:31 超现实数:康威如何从“无”中创造出庞大的数字系统 02:47:06 生命游戏:细胞自动机中的可计算性与复杂性 02:51:00 停机问题的“黑洞”:为什么随机程序几乎总是容易预测的 03:16:09 无穷象棋:在一个无限棋盘上,白方如何保证在有限步内获胜 03:33:24 终极之美:超穷序数与超越无穷的计数艺术 🌟 精彩内容 🛠️ 希尔伯特旅馆的魔力 哈姆金斯生动地解释了无穷的特性。在希尔伯特旅馆,即使房间全满,只要让每位客人挪到 n+1 号房,就能空出 0 号房给新客人。这种违反欧几里得“整体大于部分”原则的直觉,正是无穷大世界的入场券。 💻 哥德尔的致命一击 哈姆金斯深入浅出地讲解了不完备性定理。它终结了希尔伯特试图将数学变成“死记硬背的计算程序”的梦想。它告诉我们,数学研究永远需要创造力和想象力,因为没有任何一套公理系统能捕捉到所有的真理。 🌌 数学多元宇宙观 这是本期最震撼的哲学观点。哈姆金斯认为,就像物理学中可能存在平行宇宙一样,数学也存在“多元宇宙”。在某些宇宙中,连续统假设是真的;在另一些宇宙中则是假的。我们不应该寻找唯一的真理,而应该探索不同宇宙间的联系。 🍎 抽象比物理更真实 “我不认为我们对物理对象的本质有如此清晰的存在概念。”哈姆金斯挑战了常识。他认为物理世界(如夸克、波函数)极其神秘且不断被推翻,而数学对象(如空集、数字)的逻辑属性却永远清晰、稳定且可被彻底理解。 ♟️ 无穷象棋与序数 通过无穷象棋,哈姆金斯展示了“序数”的力量。黑方可以控制输掉比赛的时间(比如要求白方必须花一百万步才能将死),但白方依然拥有确定的获胜策略。这展示了数学如何精确地处理“有限但无界”的复杂情况。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

227分钟
1k+
5个月前
#378.破解大脑的“损失函数”:为什么 AI 喂了万亿数据,还是不如三岁小孩?

#378.破解大脑的“损失函数”:为什么 AI 喂了万亿数据,还是不如三岁小孩?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷深度对话播客《Dwarkesh Podcast》Adam Marblestone – AI is missing something fundamental about the brain 为什么人类大脑只需极少的数据就能学会复杂的技能,而大语言模型(LLM)即便吞噬了整个互联网的文本,在逻辑推理上依然显得“笨拙”?本期嘉宾 Adam Marblestone 带来了一个颠覆性的视角:AI 缺少的可能不是参数,而是大脑中那套由进化精心编码的“损失函数”。 Adam 是 Convergent Research 的 CEO,也是神经科学与 AI 交叉领域的领军人物。在这场深度对话中,他拆解了大脑的“双系统”架构:一个负责全向推理的“学习子系统”(皮层),以及一个内置了千万年生存智慧、负责引导学习方向的“操纵子系统”。从连接组学的技术挑战,到用 Lean 语言实现数学证明的自动化,再到如何通过“专注研究组织”(FRO)填补科学基础设施的空白,Adam 展示了一幅通往通用人工智能(AGI)的全新路线图。这不仅是一场关于神经科学的科普,更是一次关于智能本质的终极追问。 👨‍⚕️ 本期嘉宾 Adam Marblestone,Convergent Research 首席执行官,前 MIT 物理学家,曾任 Google DeepMind 研究员。他致力于通过“专注研究组织”(FROs)推动科学基础设施的变革,目前正领导包括 E11 bio(大脑连接组图谱绘制)和 Lean(形式化数学语言)在内的多个前沿项目。 ⏱️ 时间戳 00:00 开场 & 播客简介 大脑与 AI 的效率之争 02:01 千万亿美金的问题:为什么大脑比 AI 更高效? 04:54 进化的“课程表”:大脑如何内置复杂的损失函数 08:10 皮层:一个拥有“全向推理”能力的通用预测引擎 11:39 为什么 LLM 擅长预测下一个词,却不擅长“填空”? 进化的秘密:奖励函数与泛化 14:12 “摊销式推理”:为什么大脑反应飞快而 AI 需要思维链? 18:29 基因组的瓶颈:为什么区区 3GB 数据能构建出智能? 23:06 操纵子系统:进化如何把“怕蜘蛛”编码进你的神经元 28:25 奖励函数的“下游”:如何把抽象概念连接到本能反应 生物硬件与数字心智 33:19 20 瓦的奇迹:大脑的能效优势与硬件协同设计 35:55 突触 vs 代码:细胞层面的复杂性是在做“胶水”工作吗? 42:24 逆向工程大脑:我们离“全脑仿真”还有多远? 解密大脑:连接组学与技术革命 49:43 绘制大脑地图:从电子显微镜到光学连接组学的跃迁 53:58 行为克隆:能不能把大脑的内部状态“蒸馏”给 AI? 56:59 为什么我们需要几十亿美金去画一张小鼠大脑图谱? 数学自动化与可证明的未来 01:00:37 Lean 语言:当数学证明变成强化学习的信号 01:04:30 自动化的“聪明” vs 智能:黎曼猜想能被机器攻克吗? 01:06:26 可证明软件:如何打造一个“不可黑掉”的数字世界 科学的基础设施:FRO 与差距地图 01:11:16 为什么科学家不只需要白板,还需要“哈勃望远镜”? 01:12:30 差距地图:寻找那些被风投和政府忽视的科学盲区 01:15:03 结语:科学的未来在于规模化与基础设施的协同 🌟 精彩内容 💡 大脑的“双系统”理论 Adam 提出,大脑并非一个单一的学习算法。皮层(学习子系统)是一个极其通用的预测机器,但它需要被皮层下区域(操纵子系统)引导。进化虽然没有给大脑预装知识,但它预装了一套极其精密的“奖励函数”,告诉大脑哪些信息是关键的。 “进化可能在损失函数里内置了大量的复杂性……就像有大量的 Python 代码,为大脑不同部分生成了一套特定的‘课程表’。” 🛠️ 摊销式推理(Amortized Inference) 为什么人类看到危险会瞬间躲避,而 AI 往往需要多步推理?Adam 解释了“摊销”的概念:大脑通过长期的演化和学习,将复杂的贝叶斯推理固化成了前馈的神经反应。 “大脑把一些东西‘固化’进了近似的前向传播里,而不需要像 AI 那样在测试时进行大量的采样计算。” 🚀 连接组学:大脑的“哈勃望远镜” Adam 正在推动的 E11 bio 项目旨在通过降低成本来绘制完整的大脑连接组。他认为,如果我们能像人类基因组计划那样,将大脑图谱的绘制成本降低几个数量级,我们将能直接看清智能的物理结构。 “如果你能用几十亿美元就全面解决这个问题,在 GPU 价值数万亿美元的宏大背景下,这笔投资是极其合理的。” 💻 形式化数学与 Lean 作为 Lean 的董事会成员,Adam 认为数学证明是强化学习的完美赛道。因为证明的正确性是可以被机器自动验证的,这为 AI 提供了一个清晰的奖励信号。 “我们将能够拥有搜索证明并找到它们的工具,就像我们有 AlphaGo 一样。有了可验证的信号,它就能行。” ❤️ 科学的“差距地图” Adam 提出了“专注研究组织”(FRO)的概念,旨在解决那些“对研究生太难,对初创公司太亏”的科学工程问题。他认为,现代科学正处于一个需要“规模效应”的转折点。 “很多科学领域都需要规模。我们缺少一些可扩展的基础设施,这在几乎每个领域都存在,甚至包括数学。” 🌐 播客信息补充 翻译克隆自:Dwarkesh Podcast 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的; 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

78分钟
1k+
5个月前
#377.法律界的 AI 革命:Harvey 如何重塑法律市场

#377.法律界的 AI 革命:Harvey 如何重塑法律市场

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷顶级科技风投播客《No Priors》Scaling Legal AI and Building Next-Generation Law Firms with Harvey Co-Founder and President Gabe Pereyra 本期嘉宾 Gabe Pereyra 的经历是技术理想主义与商业敏锐度结合的典范。作为 Harvey 的联合创始人兼总裁,他带领公司在短短三年半内,从两个人的 Airbnb 宿舍发展到拥有 500 名员工、服务上千家顶尖律所与财富 500 强企业的行业巨头。 在这期节目中,Gabe 将带我们深入法律 AI 的“深水区”。你将听到为什么法律文件本质上是“非结构化的代码”,以及 Harvey 如何通过构建法律 IDE 和智能体工作流,解决大模型在专业领域中的“幻觉”与上下文缺失问题。Gabe 还会揭秘他们独特的“前线部署工程师”模式,以及为什么在 AI 时代,组织生产力的提升远比个人 Copilot 更具颠覆性。无论你是关注 AI 落地应用的开发者,还是寻求行业转型的专业人士,这期关于“AI 如何啃下最硬骨头”的对话都不容错过。 👨‍⚕️ 本期嘉宾 Gabe Pereyra,Harvey 的联合创始人兼总裁。在创办 Harvey 之前,他曾是 DeepMind 和 Meta 的顶级 AI 研究员,专注于强化学习和大语言模型。他凭借深厚的技术背景和对法律行业的独特洞察,将 Harvey 打造成为法律 AI 赛道的领头羊。 ⏱️ 时间戳 00:00 开场 & 嘉宾背景介绍 定义法律 AI 的新形态 02:14 规模与现状:从 1000 家客户看 Harvey 的增长曲线 03:52 拒绝平庸:为什么 Harvey 不是另一个 ChatGPT 包装盒? 05:46 法律即代码:如何像理解分布式系统一样理解大型并购案 08:06 协作平台化:连接财富 500 强法务部与顶级律所的纽带 智能体与法律推理的未来 09:51 模拟初级律师:将法律任务分解为智能体逻辑树 11:39 强化学习的挑战:在无法“单元测试”的法律界,如何构建奖励函数? 13:59 专家经验的数字化:顶级合伙人的“推理链”如何转化为模型能力 16:18 验证的艺术:如何判断一个持续三年的并购案是否“正确”? 商业实战与部署策略 19:21 前线部署工程师(FDE):为什么 AI 公司也需要“重度交付”? 22:34 快速普及的秘诀:法律行业为何对 AI 展现出惊人的接纳度 24:14 终极追问:Harvey 为什么不直接开一家 AI 驱动的律所? 26:18 市场天花板:从一万亿法律市场到五万亿专业服务市场 创始人进化论 28:11 身份转变:从 DeepMind 研究员到 500 人公司的 CEO 31:47 早期信念:在 GPT-4 诞生前,如何坚定押注 AI+法律? 34:10 产品形态的演进:从文档上传到精准引文的“啊哈时刻” 38:11 预测未来:为什么组织生产力才是 AI 的下一个主战场 40:18 协作式 AI:人类与模型如何在大规模组织中高效协同 🌟 精彩内容 💡 法律文件的“代码属性” Gabe 提出了一个深刻的见解:法律工作本质上是处理极其复杂的非结构化信息。一个大型基金的组建或跨国并购,其复杂程度不亚于架构一个分布式软件系统。Harvey 的价值在于将这些“文字代码”结构化,让 AI 能够像 IDE 辅助程序员一样辅助律师。 🛠️ 智能体(Agentic)工作流 Harvey 正在尝试将初级律师的工作模式“智能体化”。通过强化学习(RL),模型不再只是生成一段文字,而是学会去文档库找资料、查判例、起草备忘录,并根据合伙人的反馈进行迭代。这种对复杂任务的拆解和执行是法律 AI 走向深度的关键。 🚀 “前线部署”的重公司模式 与传统的轻量化 SaaS 不同,Harvey 成立了前线部署工程师团队。Gabe 认为,要让 AI 真正进入大银行或大律所的血液,必须有人坐在客户身边,帮他们梳理业务逻辑并连接计费、治理等内部系统。这种“重交付”模式正在成为企业级 AI 成功的标配。 ❤️ 组织生产力 vs 个人生产力 Gabe 指出,目前很多人关注的是让个人效率提升 20%,但这并不直接等于公司产出提升 20%。未来的核心在于“组织生产力”——即如何通过 AI 基础设施,让成千上万人的大型组织(如沃尔玛或顶级律所)以全新的方式协同工作。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

43分钟
1k+
5个月前
#375. Vibe Coding 宣言:为何Claude Code并非终局,以及 IDE 之后将迎来什么

#375. Vibe Coding 宣言:为何Claude Code并非终局,以及 IDE 之后将迎来什么

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷前沿技术播客《Latent Space》 本期嘉宾是拥有 45 年编程经验的传奇工程师 Steve Yegge。他曾先后在亚马逊、谷歌担任要职,目前在 Sourcegraph 推进 AI 革命。在这期充满能量的对话中,Steve 提出了一个足以让所有程序员“破防”的命题:Vibe Coding(氛围编程)。他认为,手动编写代码的时代已经终结,如果你在 2025 年还在依赖 IDE 逐行敲代码,你可能正在变成一名“实习生”。 Steve 深入探讨了为什么资深工程师最抵触 AI,如何利用多 Agent 系统实现 10 倍速的生产力飞跃,以及为什么我们正在进入编码的“约翰迪尔(John Deere)时代”。这不仅是一场关于工具的讨论,更是一场关于程序员身份重塑的深刻反思。无论你是刚入行的 AI 工程师,还是拥有数十年经验的老兵,这期节目都将刷新你对“编程”二字的认知。 👨‍⚕️ 本期嘉宾 Steve Yegge,资深软件工程师、技术博客作家。他拥有超过 45 年的从业经验,曾是亚马逊早期平台的关键架构师,并在谷歌领导过多个核心项目。他以犀利的技术评论著称,近期因提出“Vibe Coding”概念并在 Sourcegraph 推动 AI 编码工具 amp 而备受瞩目。 ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 Vibe Coding:一场关于效率的革命 01:18 资深工程师的身份危机:为什么 15 年经验可能成为 AI 时代的障碍 02:49 劲爆观点:2025 年还在用 IDE 的人,就是差劲的工程师 03:55 信任 AI 的代价:为什么你需要 2000 小时的磨合才能掌握“手感” 04:51 案例分享:当 12 年老兵遇到“无所畏惧”的年轻 Vibe Coder 从工具到工厂 08:45 告别手动编辑:为什么编辑 AI 生成的代码是极其昂贵的 10:43 为什么 Claude Code 还不够:我们需要的是 Agent 编排仪表盘 12:38 多 Agent 协作:构建一个会自动沟通、互相发邮件的“Agent 小村庄” 14:52 撞上“合并之墙”:当每个人的生产力提高 10 倍,代码合并成了最大的瓶颈 16:45 约翰迪尔时代:代码的“工厂化生产”与小农经济的终结 行业博弈与技术真相 21:21 后端与基础设施:AI 真的不能碰核心系统代码吗? 23:58 颠覆 Joel Spolsky:为什么在 AI 时代,“重写”比“修复”更香 25:58 巨头执行力大 PK:谷歌的转身、OpenAI 的混乱与 Anthropic 的防御墙 28:34 2025 展望:开源模型的崛起与“七个月差距”的缩小 工程师的未来 29:58 孩子们还该学编程吗?从学“语法”转向学“超集概念” 31:48 进阶技巧:为什么让 Agent 写代码去调用工具,比直接调用更有效 32:43 结语:科技再次变得有趣,欢迎来到不写代码的新世界 🌟 精彩内容 💡 10 倍生产力差距的残酷现实 Steve 透露,在 OpenAI 内部,拥抱 AI 工作流的工程师与坚持传统方式的人相比,生产力差异已达 10 倍。这种差距在绩效评估中是“刺眼且致命的”。他警告说,如果你不学习如何与 Agent 协作,一年后即使是世界级工程师也可能退化到实习生水平。 🛠️ 告别 IDE,拥抱“编排仪表盘” Steve 认为 IDE 的核心是辅助人类写代码,但未来的趋势是人类不再写代码。因此,IDE 将被“Agent 编排仪表盘”取代。你早上上班的第一件事不是打开编辑器,而是询问你的 Agent 团队:“进展如何?哪些任务需要我决策?” 🚀 编码的“约翰迪尔时代” 这是一个极具启发性的比喻:现在的程序员就像用镰刀收割的农民,而 AI Agent 则是大型联合收割机。虽然很多人在情感上抵触这种“工厂化”,但农业机械化是不可阻挡的趋势。未来的顶尖工程师将是那些能够驾驭“代码工厂”的工厂主。 💻 颠覆“永远不要重写代码” Joel Spolsky 曾告诫程序员永远不要重写代码,但 Steve 认为在 AI 时代这条规则已死。LLM 在“从零构建”上的表现远好于“在复杂旧代码中修补”。通过让 AI 不断生成更好的新版本来替换旧版本,将成为最快、最可靠的开发路径。 ❤️ 给下一代的建议:学架构,而非语法 面对“孩子是否该学编程”的问题,Steve 的回答是肯定的,但路径变了。重点不再是学习特定语言的语法,而是学习函数、类、分布式系统等核心工程概念。只有理解了底层逻辑,你才能在更高维度上指挥 AI 协同工作。 🌐 播客信息补充 翻译克隆自:Latent Space Podcast 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

35分钟
1k+
5个月前
#376.深度学习之争:LLM 是通往通用人工智能的终途,还是误入歧途的“狂热崇拜”?

#376.深度学习之争:LLM 是通往通用人工智能的终途,还是误入歧途的“狂热崇拜”?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:顶尖 AI 思想辩论 Do LLMs Understand? AI Pioneer Yann LeCun Spars with DeepMind’s Adam Brown. 当“深度学习三巨头”之一、Meta 首席科学家 Yann LeCun,遇上 DeepMind 的物理学家兼 AI 研究员 Adam Brown,会碰撞出怎样的火花?这不仅是一场技术讨论,更是一场关于“智能本质”的哲学思辨。 现在的 LLM(大语言模型)真的理解它在说什么吗?为什么一个四岁的孩子只需要几千小时的视觉信息就能理解物理世界,而 AI 读遍了整个互联网却依然不会洗碗?Yann LeCun 在节目中直言不讳地指出“当前的机器学习烂透了”,并预言 LLM 永远无法达到人类水平的智能;而 Adam Brown 则以数学奥赛的突破为例,坚信智能可以从规模中涌现。从“修马桶测试”到“递归自我改进”,从“喷气发动机的安全性”到“2036 年的意识觉醒”,这期节目将带你穿透 AI 的泡沫,直击技术最底层的逻辑与未来。 👨‍⚕️ 本期嘉宾 Yann LeCun:Meta 首席人工智能科学家,纽约大学教授,2018 年图灵奖得主,被誉为“卷积神经网络之父”。他是 AI 乐观主义者,但也是当前 LLM 路径的坚定批判者。 Adam Brown:Google DeepMind 研究科学家,理论物理学家。他致力于从物理学视角研究 AI 的涌现行为,对当前神经网络范式的潜力持积极态度。 ⏱️ 时间戳 00:00 开场 & 播客简介 神经网络的前世今生 01:10 飞机与鸟:神经网络是对大脑的模仿还是启发? 03:02 深度学习简史:从 80 年代的冷宫到 2010 年的翻红 05:08 物理学家的视角:简单规则如何产生复杂的“涌现”行为 LLM 的能力边界之争 06:40 快问快答:AI 真的有“理解”和“意识”吗? 08:50 LLM 的本质:预测下一个词真的能产生智能吗? 11:11 数据密度对比:为什么四岁小孩比最强 LLM 更高效? 14:24 样本效率 vs 最终能力:AlphaZero 带来的启示 17:07 智能的证明:LLM 在国际数学奥林匹克竞赛中的表现 19:53 黑箱中的“理解”:我们能看透 AI 的神经元电路吗? 通往 AGI 的不同路径 23:16 “机器学习烂透了”:为什么 AI 至今不会修马桶? 28:45 乐观派 vs 怀疑派:我们正处于虚假的曙光中吗? 34:43 莫拉维克悖论:语言很简单,现实世界很复杂 35:46 JEPA 与世界模型:超越生成式 AI 的下一场革命 安全、控制与未来社会 41:05 智能 vs 自主:为什么聪明的 AI 不一定危险? 45:33 目标不一致风险:当 AI 学会欺骗与勒索 48:16 开源的必要性:防止数字世界被少数巨头垄断 49:49 喷气发动机类比:AI 安全本质上是一个工程问题 意识与道德的终极追问 51:40 哲学家提问:AI 产生意识还需要缺少什么? 54:13 意识的拆解:主观体验、道德价值与硅基生命 56:39 2036 年的愿景:一场由 AI 驱动的新文艺复兴 🌟 精彩内容 💡 语言不是智能的全部 Yann LeCun 提出了一个发人深省的观点:人类社会过于迷信语言。我们认为能言善辩的人聪明,所以觉得 LLM 聪明。但实际上,语言的信息量极低,真正的智能存在于对物理世界的感知和预测中。 “一个四岁孩子看到的视觉数据量,和最大的 LLM 用有史以来所有文本训练的数据量是相当的。但孩子学会了物理常识,AI 却没有。” 🛠️ 莫拉维克悖论与“修马桶”测试 为什么 AI 能通过律师考试却不会修马桶?Yann 认为 LLM 这种“离散 token 预测”的架构在处理连续、高维、充满噪音的现实世界时完全失效。他提出的 JEPA 架构试图让 AI 像人类一样学习“抽象表示”,而不是死磕像素。 “你永远不可能用大语言模型驱动的机器人来给你修马桶,它根本无法理解现实世界。” 🚀 涌现的魅力:从简单到复杂 Adam Brown 从物理学角度反驳,认为我们不应低估简单规则的力量。就像进化论的唯一目标是“繁衍”,却创造了生物多样性;LLM 的目标只是“预测下一个词”,却在过程中被迫学会了逻辑、数学和编程。 “为了最准确地预测下一个词,它意识到自己需要搞明白怎么做数学,并在内部建立了一个电路。” 🛡️ AI 安全是工程问题,而非科幻剧本 对于“机器人接管世界”的恐惧,Yann 表现得非常淡定。他认为智能不等于自主,我们可以像设计喷气发动机一样,为 AI 设定明确的目标函数和不可逾越的护栏。 “超级智能的出现不会是一个‘事件’,它是一点一点发生的。我们会像信任双引擎飞机飞越大洋一样信任 AI。” 🌈 2036:意识的拆解 当被问及 AI 何时会有意识时,Adam 给出了 2036 年这个具体的数字。他认为意识并非某种神秘的“灵魂”,而是信息处理到一定程度后的产物。未来我们可能会发现,意识可以被拆解成不同的能力维度。 “我们终于有了一个智能的模型生物,也许我们可以把它变成一个意识的模型生物,来回答困扰人类已久的问题。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

62分钟
1k+
5个月前
#374.怀疑是你的超能力:诺奖物理得主 Saul Perlmutter 聊科学思维、决策艺术

#374.怀疑是你的超能力:诺奖物理得主 Saul Perlmutter 聊科学思维、决策艺术

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:挪威主权财富基金官方播客《In Good Company》Why Doubt Is a Superpower | Nobel Prize–Winning Physicist Saul Perlmutter | In Good Company 本期嘉宾是 2011 年诺贝尔物理学奖得主 Saul Perlmutter。他不仅是一位揭示了“宇宙加速膨胀”奥秘的顶尖科学家,更是一位致力于推广“科学思维”的思想家。在不确定性日益增加的今天,我们该如何像科学家一样思考?Saul 在节目中分享了他新书《第三个千年的思维方式》中的核心理念。你会听到:为什么“怀疑”不是弱点而是超能力?如何利用“盲分析”和“情景规划”来对抗投资和生活中的确认偏误?为什么在 AI 时代,批判性思维比以往任何时候都更重要?这不仅是一场关于天体物理的深度对谈,更是一份关于如何在复杂世界中做出明智决策、与他人高效协作的实战指南。 👨‍⚕️ 本期嘉宾 Saul Perlmutter,加州大学伯克利分校物理学教授,劳伦斯伯克利国家实验室资深科学家。因发现宇宙加速膨胀而荣获 2011 年诺贝尔物理学奖。他是“超新星宇宙学计划”的负责人,也是《第三个千年的思维方式》(Third Millennium Thinking)一书的合著者。他致力于跨学科研究,在伯克利开设了深受学生欢迎的批判性思维课程。 ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 科学思维:解决全球问题的“金钥匙” 01:47 现状:我们有解决问题的技术,却缺乏沟通的能力 03:13 什么是“第三个千年的思维方式”:科学思维的社会化应用 04:40 概率思维:告别非黑即白,给你的观点“打个折” 决策的艺术:如何对抗大脑的陷阱 05:36 自信的谦逊:在 95% 的找错时间与“我们能行”之间寻找平衡 14:45 盲分析(Blind Analysis):如何在看到结果前排除偏见 18:24 投资中的应用:如何避免“羊群效应”并独立收集信息 22:08 情景规划:考虑四个极端的未来,寻找最稳健的策略 25:34 直觉与模式识别:逻辑头脑如何审视潜意识的产物 团队协作与科学文化 06:36 集体傲慢 vs. 个体谦逊:为什么需要和意见不合的人交谈 11:33 理想团队的画像:高能力、低自我、享受共同思考 13:35 室内乐的启示:从小提琴老师那里学到的精准与协作 33:15 家庭背景:科学家父亲与社会学母亲的跨界影响 AI 时代的挑战 34:11 AI 是双刃剑:它能加速落地,也能让你产生“掌握知识”的错觉 35:12 批判性思维工具包:用科学概念判断 AI 是否在“糊弄”你 宇宙的宏大叙事 36:05 宇宙学家的视角:站在微观粒子与宏观结构的交汇点 38:09 视觉化宇宙:从“无限的汤”到星罗棋布的星系 40:15 火星探险:为什么诺奖得主不想买埃隆·马斯克的单程票 42:06 诺奖背后的故事:寻找超新星的 11 年长跑与“暗能量”的发现 45:02 竞合关系:在激烈的科学竞赛中,对手也可以是盟友 总结与建议 47:03 客观真理:它是连接不同项目、修正模型的唯一锚点 49:04 给年轻人的建议:屏蔽末日论调,用建设性的参与管理不确定性 🌟 精彩内容 💡 怀疑是科学家的“刹车” Saul 认为,科学的成功不在于绝对的确定性,而在于对错误的不断追求。实验科学家 95% 的时间都在找错。这种“怀疑”并不是软弱,而是防止掉入思维陷阱的刹车。但开车不能只靠刹车,还需要“我们能搞定”的自信作为油门。 🛠️ “盲分析”对抗确认偏误 在科学实验中,为了防止科学家只看到自己想看到的结果,他们会使用“盲分析”:在所有测量和纠错完成之前,绝不打开装有最终数值的“信封”。这种方法同样可以应用在医疗决策或投资分析中,帮助我们跳出信息茧房。 🚀 投资决策中的“反羊群思维” 当一个团队讨论投资(如苹果股票)时,Saul 建议不要让大家轮流发言,因为后发言的人会深受影响。更好的做法是让所有人独立写下想法,然后再汇总讨论。利用“情景规划”去推演不同驱动力下的极端情况,能让决策更具稳健性。 🌌 宇宙加速膨胀与“暗能量” Saul 分享了那个震惊世界的发现:原本以为宇宙膨胀会因引力减速,结果测量发现它在加速。这暗示了“暗能量”的存在。他描述了寻找超新星的艰辛——这些宇宙中的“标准烛光”几百年才爆炸一次,且转瞬即逝,需要全球团队的极致协作。 ❤️ 跨越代际的“科学乐观主义” 面对充满不确定性的未来,Saul 鼓励年轻人不要被吓人的新闻劝退。他认为每一代人都有机会通过协作去创造想生活的世界。年轻人寻找长辈错误的冲动,正是科学不断进步的动力之一。 🌐 播客信息补充 翻译克隆自:Norges Bank Investment Management: Why Doubt Is a Superpower | Nobel Prize–Winning Physicist Saul Perlmutter | In Good Company 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

53分钟
99+
5个月前
#373.MCP 协议一周年

#373.MCP 协议一周年

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷顶尖 AI 技术播客《Latent Space》One Year of MCP — with David Soria Parria and AAIF leads from OpenAI, Goose, Linux Foundation 当今 AI 领域最激烈的竞争对手竟然坐到了同一个录音室里?本期节目邀请到了 Anthropic 的 MCP 项目负责人 David Soria Parra,以及来自 OpenAI、Block 和 Linux 基金会的领袖们。我们将深度拆解过去一年席卷开发者社区的 MCP(Model Context Protocol)协议。 你会听到 MCP 如何从一个 Anthropic 内部的工具,演变成由 OpenAI、微软、谷歌共同支持的行业事实标准。David 详细分享了 MCP 在身份验证、长时任务(Tasks)以及 UI 交互(MCP Apps)上的技术演进与踩过的坑。此外,节目下半场揭秘了“Agent AI 基金会”成立背后的故事:为什么这些巨头愿意放下竞争,共同维护一个中立的开源生态?这不仅是一场关于技术协议的讨论,更是关于未来 Agent 协作范式的终极预演。 👨‍⚕️ 本期嘉宾 David Soria Parra:Anthropic 技术成员,MCP(Model Context Protocol)共同创造者及核心维护者。 Jim Zemlin:Linux 基金会 CEO,拥有 22 年开源基金会运作经验。 Nick Cooper:OpenAI 代表,负责协议与开放生态系统,MCP 核心贡献者。 Brad:Block 首席工程师,开源编码 Agent 工具 Goose 的原作者。 ⏱️ 时间戳 00:00 开场:第一次在录音室集结的顶级阵容 MCP 的技术进化论 01:09 回顾 MCP 这一年:从感恩节的灵感到行业事实标准 06:31 身份验证的深水区:为什么企业级应用需要重构 OAuth 10:54 传输层的教训:从标准 I/O 到可流式 HTTP 的取舍 16:34 模型 vs 协议:代码模式(Code Mode)会取代 MCP 吗? 20:52 MCP vs Skills:垂直领域知识与横向连接层的协作 23:53 Anthropic 的“狗粮”:内部网关如何赋能研究员自助开发工具 27:32 注册中心与发现机制:未来 Agent 如何自主“安装”新技能 定义 Agent 的新边界 38:05 MCP Tasks:为长时运行的异步 Agent 提供一等公民支持 45:06 消费级愿景:让用户在感知不到 MCP 的情况下连接全世界 47:37 MCP Apps:为什么我们需要在聊天框里直接选飞机座位? 53:40 开发者号召:如何为 MCP 生态贡献高质量的 SDK Agent AI 基金会(AAIF)的内幕 57:01 世纪联手:OpenAI 与 Anthropic 是如何达成共识的? 01:02:54 Goose 的角色:参考实现如何推动协议的快速迭代 01:07:32 治理原则:为什么“品味塑造者”比厂商委员会更重要 01:12:27 为什么是现在?Agent 领域需要自己的“Linux 基金会” 01:18:01 利益驱动:捐赠项目给基金会到底能得到什么? 01:21:34 未来展望:告别“每三秒点一次同意”的异步 Agent 时代 🌟 精彩内容 💡 MCP 的“渐进式发现”哲学 David 解释了如何通过“渐进式发现”机制解决上下文臃肿问题。模型不需要一次性加载所有工具,而是根据任务需求动态获取信息。这使得 MCP 能够支撑成千上万个工具的接入,而不会拖慢模型的推理速度。 🛠️ 代码模式与协议的共生 针对“模型会写代码了,还要协议干嘛”的质疑,David 指出 MCP 提供了 AI 友好的接口文档和身份验证。即使模型进入“程序化模式”,MCP 依然是连接模型与外部世界的稳定桥梁,本质上是一种 Token 优化手段。 🚀 从文本交互到 MCP Apps 本期重点讨论了 MCPUI(现更名为 MCP Apps)。通过 iframe 架构,MCP 允许服务器向客户端发送原始 HTML 界面。这意味着未来你在和 Claude 或 ChatGPT 聊天时,可以直接在对话框里操作复杂的 UI 组件,如选座、绘图或购物,而无需在文本和应用间跳转。 🌐 基金会:Agent 时代的“避雷针” Jim Zemlin 分享了 Linux 基金会接纳 MCP 的逻辑。他认为 Agent 技术正处于“狗年”速度(一年顶七年),成立中立基金会是为了防止协议被单一巨头私有化,确保它像互联网协议一样永远开放,从而吸引全球工程师共同投入。 🤖 异步 Agent 的终极理想 Nick Cooper 表达了对未来一年最期待的突破:Agent 能够真正异步工作。我们不再需要守着屏幕点击每一个“批准”,而是可以同时派出 20 个 Agent 协同处理任务,并在完成后直接交付结果。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

86分钟
99+
5个月前
#372.睡眠科学全指南:从神经机制到实用工具,深度解析如何精准优化睡眠

#372.睡眠科学全指南:从神经机制到实用工具,深度解析如何精准优化睡眠

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:斯坦福顶尖科学播客《Huberman Lab》The Science & Practice of Perfecting Your Sleep | Dr. Matt Walker 睡眠不仅是休息,更是一场极其复杂的生理芭蕾。本期嘉宾 Matt Walker 博士是加州大学伯克利分校的神经科学教授,也是全球公认的睡眠权威。在这场深度对话中,他将带我们揭开睡眠的神秘面纱:为什么大脑在梦境中比清醒时更活跃?为什么咖啡因会带来“崩溃”式的二次疲劳?酒精到底是在帮你入睡还是在“敲晕”你的大脑?从光线对生物钟的校准,到补剂(褪黑素、镁、甚至猕猴桃)的真实红利,再到性生活如何改善睡眠质量,Matt Walker 提供了一套基于严谨科学证据的睡眠优化方案。无论你是失眠困扰者,还是追求极致表现的效率控,这期节目都将重塑你对“闭眼之后”那 8 小时的认知。 👨‍⚕️ 本期嘉宾 Matt Walker 博士,加州大学伯克利分校神经科学与心理学教授,人类睡眠科学中心创始人。他是国际畅销书《我们为什么要睡觉》(Why We Sleep)的作者,被誉为“睡眠外交官”。他致力于向公众传播睡眠科学,通过研究揭示睡眠对学习、记忆、情绪及长寿的深远影响。 ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 睡眠的生理芭蕾 02:56 什么是睡眠:一场重置身心健康的复杂生理协作 06:17 快速眼动睡眠(REM):为什么大脑活跃时身体必须“瘫痪”? 11:58 深度睡眠(NREM):成千上万神经元的“圣歌”式同步 17:18 九十分钟周期:前半夜与后半夜睡眠结构的博弈 睡眠习惯的误区与真相 28:31 半夜醒来正常吗?理解“睡眠效率”与 85% 原则 33:59 戳破“超人睡眠法”:为什么多相睡眠对成年人有害 36:51 光线杠杆:如何利用清晨阳光校准你的生物钟 物质与睡眠的博弈 42:36 咖啡因真相:它是如何通过“劫持”腺苷受体来欺骗大脑的 50:53 咖啡因崩溃:一场由于腺苷堆积引发的化学“海啸” 54:08 咖啡因半衰期:为什么下午的一杯咖啡会毁掉你的深度睡眠 59:57 酒精迷思:它不是助眠剂,而是敲晕大脑的“镇静剂” 01:05:11 酒精的代价:生长激素分泌减半与睡眠碎片化 01:15:57 大麻与 CBD:THC 对梦境的抑制与 CBD 的潜在机制 助眠补剂全解析 01:25:12 褪黑素:它是“发令员”而非“运动员”,且存在严重的剂量误区 01:42:38 镁的真相:苏糖酸镁真的能穿透血脑屏障吗? 01:50:10 意外的发现:酸樱桃汁与猕猴桃对睡眠时间的显著提升 02:00:11 色氨酸与血清素:为什么盲目补充可能导致睡眠紊乱 生活方式与高效技巧 02:05:58 午睡心法:NASA 的 26 分钟法则与避免“睡眠压力”流失 02:20:42 性、高潮与睡眠:激素释放如何开启天然的入睡开关 02:33:43 非传统技巧:为什么昨晚没睡好,今天反而“什么都别做” 02:38:31 烦恼日记:通过关闭“情绪标签页”减少 50% 的入睡时间 02:41:47 卧室禁忌:拿走所有钟表,停止对时间的灾难化想象 🌟 精彩内容 💡 睡眠是原始状态,清醒才是代价 Matt Walker 提出了一个颠覆性的视角:或许睡眠才是生命的原始基准状态,而清醒是为了生存而演化出的短暂偏离。这种观点强调了睡眠作为生物本能的不可动摇性,任何试图削减睡眠的行为都是在挑战数百万年的演化智慧。 🛠️ 咖啡因的“海啸”预警 你以为咖啡因给了你能量?不,它只是堵住了大脑感知疲劳的“耳朵”。Matt 详细解释了腺苷(Adenosine)如何像高压锅里的蒸汽一样不断累积,而咖啡因只是暂时按住了阀门。一旦咖啡因代谢掉,累积的腺苷会瞬间涌入受体,导致严重的午后崩溃。 🚀 酒精:伪装成助眠剂的“镇静剂” 很多人习惯睡前喝一杯,但 Matt 警告说,酒精诱发的是“镇静”而非“睡眠”。它会阻断对情绪修复至关重要的 REM 睡眠,并导致生长激素分泌量下降超过 50%。这种“碎片化”的无意识状态无法提供真正的修复功能。 💻 补剂的剂量军备竞赛 Matt 指出市面上 5mg 或 10mg 的褪黑素属于“超生理剂量”,远超人体自然分泌水平。科学研究表明,真正有效的剂量可能仅需 0.1mg 到 0.3mg。此外,他分享了关于酸樱桃汁和猕猴桃的惊喜数据,这些天然食物在改善睡眠时长方面的表现甚至优于许多合成补剂。 ❤️ 睡眠与关系的双向奔赴 睡眠不足会直接导致同理心下降和攻击性增加。Matt 分享的研究显示,女性每多睡一小时,次日发生性亲密的意愿增加 14%。睡眠不仅是个人健康问题,更是维持长期亲密关系的“润滑剂”。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

175分钟
2k+
5个月前
#371.Claude Code:为什么“大道至简”才是编程 Agent 的终极答案?

#371.Claude Code:为什么“大道至简”才是编程 Agent 的终极答案?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:AI Engineer 大会技术分享 为什么早期的自动化编程工具都很“烂”,而现在的 Claude Code 和 Cursor 却让人直呼好用?本期嘉宾 Jared Zoneraich(PromptLayer 创始人)将带我们拆解 Claude Code 的内部逻辑。他提出了一套反直觉的观点:最好的 Agent 架构不是复杂的流程图,而是一个简单的 While 循环;与其花精力写代码防止模型幻觉,不如“让开道路”信任模型的自主性。 在这场深度技术分享中,你将听到:Claude Code 如何利用 Bash 命令作为万能适配器?为什么“上下文”是 Agent 最大的敌人?以及在 Droid、Codex、Cursor 丛生的时代,开发者该如何选择和构建自己的 AI 工作流。这不仅是一次对 Claude Code 的拆解,更是一次关于 AI 工程化思维的深度洗礼。 👨‍⚕️ 本期嘉宾 Jared Zoneraich,PromptLayer 的创始人。PromptLayer 是全球领先的 Prompt 管理与评估平台,帮助开发者更严谨地构建和测试 AI 应用。Jared 是 AI 工程领域的资深专家,致力于探索 Agent 架构与 Prompt 工程的最佳实践。 ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 编程 Agent 的进化与突破 01:05 为什么现在的编程 Agent 终于“能用”了? 04:23 历史回顾:从 ChatGPT 复制粘贴到 Claude Code 的无头模式 05:45 核心突破:更好的模型能力 vs 更简单的架构设计 07:48 “AGI 药丸”心态:不要为解决今天的问题而过度设计 深度拆解 Claude Code 内部原理 08:55 架构哲学:简单胜于复杂,扁平胜于嵌套 11:02 核心主循环:四行代码构建的“While 循环”革命 12:39 工具箱揭秘:为什么 read、grep 和 edit 比 RAG 更高效 14:58 Bash 的魔力:作为 Agent 万能适配器的 shell 工具 16:55 待办事项(Todo Lists):如何通过非确定性指令增强可控性 上下文与 Agent 管理 19:35 上下文管理:Agent 最大的敌人是“变笨” 20:37 告别 DAG:为什么复杂的流程图是工程噩梦 25:47 沙盒与安全:如何在 YOLO 模式与企业安全间平衡 26:47 子 Agent(Sub-agents):研究员、审查员与任务分发逻辑 31:03 Skills 功能:如何构建可扩展的系统 Prompt 主流编程 Agent 横向对比 34:34 未来趋势:超级工具调用 vs 自适应推理预算 38:14 “AI 治疗师”比喻:为什么 AI 产品没有全局最优解 40:01 各显神通:Codex 的 Rust 并发、Amp 的交接模式、Cursor 的速度优势 45:24 评估与测试:如何通过“Agent Smell”判断 Agent 的健康度 实战建议与 Q&A 52:04 总结:信任模型、简单设计、Bash 为王 53:43 Q&A:如何强制 Agent 的执行顺序? 56:39 TDD 与规范驱动:AI 时代的工程原则 59:14 关于 PromptLayer:如何招聘与协作 🌟 精彩内容 💡 信任模型(Trust the Model) Jared 强调,开发者往往喜欢过度优化脚手架代码来防止模型出错。但 Claude Code 的成功证明了:给模型工具,然后“让开”。随着模型能力的提升,很多现在的硬编码逻辑在三个月后都会变成累赘。 🛠️ Bash 是 Agent 的“圣杯” 在所有的工具调用中,Bash 是最重要的。因为它简单、健壮,且拥有海量的互联网训练数据。Claude Code 通过在沙盒中运行 Python 脚本或测试用例,实现了极高的灵活性。 🚀 告别复杂的 DAG 流程 过去两年,大家都在构建拥有成百上千个节点的 DAG(有向无环图)。但现在,这种“工程噩梦”正在被简单的循环取代。依赖模型的自主探索,比硬编码每一个 if/else 语句效果更好,维护成本也更低。 🧠 上下文压缩艺术 上下文越长,模型越笨。Claude Code 通过 H2A 缓冲区管理 IO,并在上下文达到 92% 阈值时进行智能压缩。Jared 建议,将长期记忆存储在沙盒的 Markdown 文件中,而不是全部塞进对话框。 🎨 AI 产品的“品味”与视角 不同的编程 Agent 代表了不同的哲学:Claude Code 追求极致的命令行简洁,Cursor 追求 UI 交互的快感,而 Amp 探索免费与广告模式。开发者应根据“品味”选择最适合自己工作流的工具。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

63分钟
1k+
5个月前
#370.为什么我们要把数据中心建在太空?

#370.为什么我们要把数据中心建在太空?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:Forbes 科技访谈系列 Why This Entrepreneur Believes We Should Build Data Centers In Space 当马斯克在德州疯狂测试“星舰”时,有一群人已经盯上了太空里的“无限能源”。本期嘉宾 Philip Johnson 是 Star Cloud 的创始人,这家由英伟达支持的初创公司,刚刚完成了将 H100 芯片送上太空的壮举。 为什么在地球上建数据中心越来越难?为什么“星舰”的成功是太空算力的“iPhone时刻”?在没有空气和水的真空里,价值数万美金的 GPU 如何散热?Philip 将带我们揭开“天基数据中心”的神秘面纱。这不仅是一个关于航天技术的硬核分享,更是一场关于 AI 算力成本、能源革命以及人类如何跳出地球资源限制的深度对话。 👨‍⚕️ 本期嘉宾 Philip Johnson,Star Cloud CEO 兼联合创始人。他曾任职于麦肯锡,长期与各国政府航天机构合作。他创办的 Star Cloud 致力于利用大幅下降的发射成本,在太空构建大规模 AI 算力基础设施,目前已获得英伟达、Y Combinator 等顶级机构投资。 ⏱️ 时间戳 00:00 开场 & 嘉宾介绍:把英伟达 GPU 送上天 为什么是太空? 00:48 地球的瓶颈:能源限制与漫长的基建审批周期 01:11 太空的诱惑:无限太阳能与低至 0.5 美分的电力成本 01:59 规模想象力:四公里见方的太阳能板与“太空发电厂” 星舰:改变游戏规则的变量 03:01 范式转移:为什么“全重复使用”是航天成本的分水岭 03:35 算一笔经济账:从每公斤 6500 美元到 10 美元的成本暴降 硬核工程挑战 04:34 实验报告:第一块在太空运行的 H100 验证了什么? 05:41 散热难题:在真空中,如何利用“辐射冷却”给芯片降温 07:12 制造挑战:把散热器的成本降低 100 倍 算力市场的未来 08:26 需求预测:为什么十年后一半的新增算力会在太空? 09:47 时间表:等待“星舰”量产后的成本反转曲线 10:09 辐射防护:如何用粒子加速器测试芯片的“防弹衣” 11:03 硬件折旧:太空中的 H100 会比地球上更耐用吗? 创业初衷与商业路线图 11:52 创始团队背景:从 SpaceX 到微软数据中心的大牛组合 12:44 灵感来源:如果能量传输损耗大,那就把数据中心搬到能源源头 13:45 商业化第一步:为卫星提供“边缘计算”,解决天地传输带宽瓶颈 15:58 终极愿景:二十年后,把高能耗工业留在太空,把绿色留给地球 🌟 精彩内容 💡 能源是 AI 的第一生产力 Philip 指出,在地球上新建百兆瓦级数据中心,能源审批可能耗时数十年。而太空拥有 24 小时不间断的太阳能。一旦发射成本通过“星舰”降下来,太空电力的边际成本几乎为零。 🚀 “星舰”带来的成本奇迹 目前的航天就像“飞一次纽约就拆一架飞机”。而星舰的完全可重复使用,将发射成本从每公斤数千美元压低到两位数。这意味着在太空建数据中心的综合成本,未来将比地球便宜 10 倍。 ❄️ 物理学的挑战:辐射散热 在没有空气对流的太空,散热全靠红外辐射。Star Cloud 研发了巨大的薄膜散热器,利用温差将热量排向零下 270 摄氏度的宇宙深空。这不再是科学难题,而是如何大规模廉价制造的工程挑战。 🛡️ 保护最脆弱的“大脑” AI 芯片在高能粒子轰击下极易失效。Philip 透露,他们利用粒子加速器对 H100 进行了“轰炸测试”,找出了芯片最脆弱的部位,并结合物理屏蔽与软件算法,让最先进的商用芯片能在恶劣的辐射环境中存活。 🌐 播客信息补充 翻译克隆自:Forbes: Why This Entrepreneur Believes We Should Build Data Centers In Space 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

17分钟
1k+
6个月前
#369.OpenAI 传奇研究员 Noam Brown:多智能体 AI 的演进与人类数据的“死路”

#369.OpenAI 传奇研究员 Noam Brown:多智能体 AI 的演进与人类数据的“死路”

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:OpenAI 顶尖研究员 Noam Brown 在加州大学伯克利分校(UC Berkeley)的深度技术分享。 Agentic AI MOOC | UC Berkeley CS294-196 Fall 2025 | Multi-Agent AI by Noam Brown Noam Brown 是 AI 界的传奇人物,他主导开发的 Libratus 和 Pluribus 在德州扑克领域击败了人类顶尖高手,随后的 Cicero 更是首次在复杂的《外交》策略游戏中展现了超人类的谈判与协作能力。在这场演讲中,Noam 并没有空谈概念,而是从博弈论的底层逻辑出发,深刻揭示了为什么在语言模型时代,我们不能简单复刻 AlphaGo 的成功路径。他提出了一个极具争议但也极具洞察力的观点:如果你的目标是让 AI 学会和人类合作,那么想绕开人类数据是行不通的。无论你是对 AI 智能体(Agent)感兴趣的开发者,还是关注通用人工智能(AGI)演进路径的观察者,这期关于多智能体协作、推理扩展和博弈论心法的分享都不容错过。 👨‍⚕️ 本期嘉宾 Noam Brown,OpenAI 研究员。曾就职于 Meta AI(FAIR)。他是世界上首个在六人桌德州扑克中击败顶尖职业选手的 AI——Pluribus 的核心作者,也是《外交》游戏 AI——Cicero 的主导者。他的研究重点在于如何通过多智能体强化学习和搜索算法,让 AI 在复杂、不完美信息的环境中实现战略推理与协作。 ⏱️ 时间戳 00:00 开场 & 播客简介 AI 进化的底层逻辑 02:02 消失的最后一块拼图:为什么 LLM 还没实现像 AlphaGo 那样的自我提升? 04:04 偏见警告:我们对“自我博弈”的直觉是否被围棋过度拟合了? 06:17 德州扑克悖论:赢钱最多的人,不一定是技术最无懈可击的人 08:49 稳健性的代价:假设对手能看穿你的“模型权重” 不完美信息游戏的博弈心法 12:39 算法的局限:为什么 PPO 算法玩不好“石头剪刀布”? 15:58 概率的艺术:在扑克和现实中,动作的价值取决于你“多久做一次” 18:33 击败人类选手的算法:从虚拟博弈到遗憾匹配(Regret Matching) 22:36 寻找万能算法:跨越单智能体与多智能体强化学习的鸿沟 合作的真相:人类数据是绕不开的坎 23:36 零和博弈的冷酷:为什么在纯粹的对抗中,沟通毫无意义? 25:26 争议观点:想让 AI 学会与人合作,不使用人类数据是“死路一条” 26:52 最后通牒博弈:当数学上的“最优解”遇到感性的人类 31:21 《外交》游戏挑战:如何在充满了背叛与信任的环境中建模? 34:12 均衡的陷阱:为什么一个完美的 AI 进场后会被人类“虐惨”? 37:07 Cicero 的成功公式:模仿人类 + 推理扩展 + 强化学习环境 多智能体 AI 的新范式 39:14 o1 系列的启示:当推理性能曲线开始疯狂左移 41:51 延迟瓶颈:为什么多智能体协作是解决串行思维链(CoT)的关键 42:31 并行扩展技术:共识(Consensus)与 N 中选优的利弊权衡 44:45 路由即智能:多样性是多智能体系统的核心力量 46:01 现状与未来:自然语言已成为智能体之间完美的“沟通协议” 48:19 临界点:为什么现在是投身多智能体 AI 研究的绝佳时机 🌟 精彩内容 💡 AI 进化的三部曲 Noam 认为 AI 突破遵循:预训练(学人类)、推理扩展(想更久)、自我提升(超人类)。LLM 目前卡在了第三步。在双人零和游戏(如围棋)中,自我博弈能完美解决问题,但在复杂社会场景中,这远远不够。 🛠️ 为什么 PPO 算法会失效? 在不完美信息游戏中,简单的强化学习算法(如 PPO)无法收敛到纳什均衡。Noam 解释道,这是因为 AI 必须学会“随机化”自己的策略。如果你总是诈唬,价值就会归零;你必须以精确的概率平衡动作,这需要更高级的博弈论算法。 🚀 合作的“死路”论 这是全场最深刻的洞察:在“最后通牒博弈”中,数学最优解是只给对方一分钱,但现实中人类会因为觉得不公平而拒绝。Noam 认为,文化差异和人类的感性无法通过纯算力模拟出来。要学合作,必须喂给 AI 人类数据。 💻 Cicero:谈判 AI 的巅峰 通过《外交》游戏,Noam 展示了如何让 AI 既能像人一样说话谈判(Cicero),又能保持强大的战略推理。它的核心逻辑不是寻找数学上的绝对完美,而是寻找针对人类群体的“最优响应”。 🌐 播客信息补充 翻译克隆自: 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

50分钟
1k+
6个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧