跨国串门儿计划 - 节目列表

#545.先锋集团:为投资者省下万亿美金的共产主义资本家

#545.先锋集团:为投资者省下万亿美金的共产主义资本家

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:商业史播客《Acquired》Vanguard: The communist capitalist who saved investors a trillion dollars (Audio) 本期节目是一场关于 Vanguard 的超长篇商业史深度拆解。Ben Gilbert 和 David Rosenthal 从 Jack Bogle 的人生讲起:他出生在 1929 年大萧条前夜,童年家道中落,却靠奖学金进入 Princeton,并用一篇关于共同基金的本科论文,开启了自己改变金融行业的一生。 这期节目不仅讲述了 Vanguard 如何创造面向个人投资者的第一只指数基金,更深入拆解了它真正革命性的地方:不是“指数基金”本身,而是公司结构。Vanguard 由旗下基金的投资者共同拥有,没有外部股东,也不以利润最大化为目标。Jack Bogle 坚信低费用会长期复利,而高费用会侵蚀普通人的财富。正是这种“共产主义式的资本主义”结构,让 Vanguard 能持续降低费用,并迫使整个资产管理行业跟随降费,最终把原本会流向华尔街的一万亿美元,留在了普通投资者口袋里。 节目后半段也讨论了 Vanguard 成功之后的新问题:ETF 的兴起、Fidelity 和 BlackRock 的反击、客服和技术短板、客户关系被券商平台掌握、私人资产与投顾业务的新方向,以及被动投资规模过大是否会带来系统性风险。这不仅是一家金融公司的故事,更是一堂关于结构、激励、复利、低成本、信任与长期主义的商业课。 👥 本期主持人 Ben Gilbert 与 David Rosenthal,商业史播客《Acquired》的两位主持人。他们长期研究伟大公司、资本结构、商业模式与行业演化。本期他们以 Vanguard 为主线,讲述 Jack Bogle 如何通过公司结构和低费用理念,重塑全球资产管理行业。 ⏱️ 时间戳 00:00 开场 & 播客简介 Vanguard 为什么重要 01:27 从一句玩笑开始:这不就是 index fund 吗? 01:53 Vanguard 的规模:十万亿美元级 passive index fund 巨头 03:27 “共产主义式的资本主义”:客户拥有公司的独特结构 04:27 Jack Bogle 与一万亿美元财富转移 05:31 “卧底慈善家”:没有拿走本可以属于自己的财富 Jack Bogle 的早年人生 06:51 大萧条前夜出生:一个金融英雄的起点 08:25 家道中落、父亲离家、兄弟们靠打工求生 10:59 Blair Academy 与兄弟之间的大学机会抉择 13:08 Princeton、经济学与一门只拿 C- 的课程 15:48 一篇 Fortune 文章改变人生:共同基金行业的发现 16:49 open-end fund 的诞生与共同基金的早期结构 18:21 broker-dealer 分销、销售佣金与高费用体系 20:01 管理公司如何从基金规模中赚钱 24:19 Bogle 本科论文的核心洞察:费用会吞噬回报 27:53 加入 Wellington:从助理到 35 岁成为总裁 Wellington 危机与第一次被赶下台 29:28 保守的 Wellington 遇上疯狂的 GoGo 年代 30:51 Fidelity、Jerry Tsai 与高换手成长型基金的崛起 35:15 Jack 接到任务:做任何必要的事来拯救 Wellington 39:04 与 Ivest 合并:用 40% 股权换 GoGo 新血液 42:18 泡沫破裂、石油危机与 Wellington 资产大缩水 45:11 Jack 的 Jerry Maguire 时刻:我们到底在干什么? 46:22 mutualize 的激进想法:把公司还给基金持有人 48:47 合伙人反击:Jack 被解除 Wellington Management CEO 职务 51:01 法律缝隙:他仍然是基金董事会主席 52:52 第二天反击:用基金董事会推动共同所有制 Vanguard 的诞生 55:49 250 页报告:基金应该掌控自己的命运吗? 57:43 微弱胜利:先只接管后台行政管理 59:53 行业震动:同行担心他会毁掉整个基金行业 01:03:01 “Vanguard”这个名字的由来:英国海军旗舰与彻底胜利 01:04:32 现实很冷淡:只做后台业务,没人真正害怕 01:05:17 第二场革命的伏笔:如果不提供投资建议,就能做指数基金 第一只散户指数基金 01:05:49 指数基金革命:不做投资判断,反而绕开限制 01:07:24 Paul Samuelson 的文章:复制市场、无销售费、低换手 01:09:15 为什么“平均水平”很难卖 01:10:10 早期指数基金的技术难题:软件、自动化与五百只股票 01:11:18 Jack 找到漏洞:跟踪 S&P 500 不算主动投资建议 01:12:12 成本重要假说:低费用让平均回报变成优秀结果 01:13:29 1% 费用的恐怖复利:退休时可能少掉 50% 财富 01:16:47 写代码、谈授权:Vanguard 500 Index Fund 的技术与授权起点 01:19:39 第一只指数投资信托基金诞生 01:20:33 失败的 IPO:目标 1.5 亿,只募到 1130 万 01:23:06 不够买 500 只股票:被迫用 280 只股票模拟指数 01:24:52 Fidelity 的嘲笑:投资者怎么会满足于平均回报? 低成本飞轮开始转动 01:26:05 共享规模经济:Vanguard 是金融业的 Costco 01:28:01 指数基金差点死掉:靠 Exeter Fund 并入续命 01:30:41 no-load 模式:取消外部销售佣金,改为内部直销 01:31:51 六年才到一亿美元,十二年才到十亿美元 01:32:15 固定收益与货币市场:低成本策略更容易获胜的地方 01:33:58 主动基金 Windsor Fund:支撑早期 Vanguard 的现金流 01:35:33 行为优势:指数投资让人更容易长期不动 01:37:11 费率下降,资产加速:指数基金终于开始起飞 01:38:08 Total Stock Market Index Fund:不只买 500 只,买下整个市场 Jack 的心脏、接班与 ETF 冲突 01:39:07 Jack 的遗传性心脏病与“继续工作”的人生哲学 01:41:02 心脏移植前仍在医院当 CEO 01:43:19 奇迹康复:本以为结束,却又活了 23 年 01:43:58 Vanguard 进入收获期:长期取舍开始回报 01:46:32 创始人与接班团队的分歧:使命不变,但打法要变 01:49:50 ETF 出现:更容易交易的共同基金 01:50:46 为什么 Bogle 本该喜欢 ETF,却极度反对 01:52:55 交易诱惑、券商佣金与做空:Jack 反对 ETF 的原因 01:54:37 State Street 推出 SPDR,Vanguard 错过先机 01:56:27 董事会摊牌:Jack 因年龄条款离任 01:58:43 Bogleheads 兴起:Jack 成为普通投资者的精神领袖 02:00:12 妥协方案:离开董事会,但保留研究中心与精神象征地位 指数投资的时代顺风 02:00:27 市场专业化:主动管理越来越难跑赢 02:03:24 财务顾问兴起:从交易佣金转向资产增长 02:04:37 dotcom 与互联网券商:投资者终于看清费用与表现 02:06:16 401k 时代:普通美国人开始大规模进入股市 02:07:17 Buffett 背书:低费用指数基金是持有股票的最佳方式 02:08:23 Berkshire 的例外:为什么 Buffett 仍建议普通人买指数 02:11:11 金融危机:被动投资和 Vanguard 的高光时刻 02:13:04 华尔街光环破裂,Vanguard 成为普通人的英雄 02:15:53 “我们不会从你身上赚钱”:危机后的信任红利 02:17:16 Buffett 与对冲基金十年赌局:Vanguard 500 大胜 Jack 之后的 Vanguard 02:21:50 金融危机后资金涌入:Vanguard 超过 Fidelity 02:23:24 低价真人投顾:Vanguard 进入财富建议业务 02:24:39 Jack 去世:五万亿美元 AUM 与两千万客户 02:26:59 他没有拿走的财富:与 Fidelity、BlackRock 创始财富对照 02:27:43 Fidelity 与 BlackRock 回归:ETF 时代的新竞争 02:29:16 Fidelity 的两大平台:401k 与券商账户 02:30:32 Vanguard 的弱点:客户可能在别人的平台上买 Vanguard 02:32:50 客服与技术短板:低利润结构的代价 02:33:52 BlackRock 收购 iShares:ETF 市场的巨大胜利 02:36:50 Vanguard 模式会不会反过来限制它? 02:37:42 第一位外部 CEO:来自 BlackRock iShares 的 Salim Ramji 02:39:46 私人资产、投顾、固定收益与退休业务的新方向 02:43:37 进入 private equity:Vanguard 能否把低费用带入私人市场? 02:45:33 增长的悖论:共同所有制公司为什么还要增长? 今天的 Vanguard 与 Wellington 的后续 02:47:26 今天的 Vanguard:12 万亿美元 AUM、5000 万投资者 02:48:50 平均费用率 0.07%,行业仍是其 6.5 倍 02:50:24 Wellington 后来怎样了:主动管理巨头的重生 02:52:25 兜回原点:Wellington 至今仍为 Vanguard 管理部分基金 分析:结构、激励与护城河 02:53:22 为什么共同所有制没有更流行? 02:55:59 金融行业的特殊性:产品本身就是资本 02:57:39 为什么需要一个 Jack Bogle 这样的人 02:59:02 Vanguard、Costco 与 Visa:共同体结构的相似性 03:01:24 战略跟随结构:低费用来自所有权结构 03:02:20 成本也会复利:时间是费用的敌人 03:03:29 被动投资危机:成功之后的新担忧 03:04:31 “被动”并不完全被动:S&P 500 也有人为选择 03:05:23 被动投资会不会最终拥有一切? 03:06:38 价格发现、共同持股与投票权的争议 03:11:22 Seven Powers:用市场份额而非利润分析 Vanguard 03:12:58 规模经济与极端反定位 03:14:46 转换成本、品牌与 Bogleheads 03:16:55 流程能力:使命驱动的人才与文化 03:17:07 Quintessence:Bogle 把公开股票投资商品化 03:19:56 一个人真的可以改变世界 冷知识、推荐与收尾 03:21:36 Vanguard 与 Microsoft:同月诞生的两场革命 03:22:29 百倍股的残酷事实:平均 65% 回撤,8 年回本 03:24:27 Jack 的书籍收入与慈善遗产 03:25:08 推荐:Acquired 的《华尔街日报》专栏 03:26:29 Ben 推荐:M5 Max MacBook Pro 03:27:32 David 推荐:Michael McKelvy、亲子观影与 Brooks Vanguard 鞋 03:29:55 致谢:研究顾问、作者、前 CEO 与资料来源 03:32:12 延伸收听:Rentech、Berkshire、Costco、Visa 03:33:03 结尾 🌟 精彩内容 💡 一万亿美元财富转移 节目开头就点出 Vanguard 和 Jack Bogle 的历史意义:通过长期降低费用、倒逼整个基金行业降价,他们让原本会流向华尔街的费用,留在了普通投资者口袋里。主持人引用《The Bogle Effect》的估算,认为 Vanguard 自身节省了超过五千亿美元费用,而它对行业的降费压力又额外节省了五千亿美元。 “Jack Bogle 和 Vanguard 促成了一万亿美元的财富转移。” 🏛️ “共产主义式的资本主义” Vanguard 最独特的地方,不只是指数基金,而是公司结构。它没有上市,没有外部股东,也没有一群要求利润最大化的资本所有者。它由旗下基金的投资者共同拥有,因此公司降低费用,本质上就是把规模经济返还给客户。 “这家公司,它的产品只服务客户的利益,不服务任何其他股东的利益。” 📉 成本也会复利 Bogle 真正狂热相信的不是“指数基金一定比主动管理好”,而是“低费用几乎一定更好”。节目用一个简单计算说明:如果 25 岁投资 10 万美元,市场年化 7%,40 年后约为 150 万美元;但如果每年支付 1% 管理费,年化变 6%,最后只有约 100 万美元。费用看似只有 1%,长期却可能吞掉退休财富的三分之一。 “在回报这件事上,时间是你的朋友;但在成本这件事上,时间是你的敌人。” 🚢 Vanguard 的诞生:理想主义与复仇心各占一半 Jack Bogle 被 Wellington Management 赶下 CEO 位置后,并没有安静离开。他利用自己仍是基金董事会主席这一法律结构缝隙,推动基金与管理公司分离,建立一个由基金持有人共同拥有的新组织。这个组织最初只能做后台行政事务,却成为日后 Vanguard 的起点。 “战略跟随结构。” 📊 第一只指数基金差点失败 今天 Vanguard 500 Index Fund 是全球最大的基金之一,但它刚推出时几乎无人问津。原本希望募集 1.5 亿美元,最后只募到 1130 万美元,甚至不够买下 S&P 500 每只股票的基本交易单位。它只能先买约 280 只股票,并靠并入另一只 Wellington 遗留基金续命。 “我不敢相信广大投资者会满足于只拿到平均回报。这个游戏的目标是成为最好的。” 🧠 指数投资的行为优势 除了低费用,指数投资还有一个重要但常被低估的优势:它让投资者更容易什么都不做。主动投资者和主动基金经理往往不断交易、试图反应市场变化,而指数投资者更容易接受“我买的是市场”这个事实,从而长期持有。 “别光想着做点什么,站着别动。” ⚔️ ETF:Jack Bogle 也会犯大错 Bogle 极度反对 ETF,因为他认为 ETF 可以盘中交易,会诱导投资者投机、频繁交易、承担交易成本,甚至做空市场。因此 Vanguard 错过了最早推出 ETF 的机会,让 State Street 和后来的 BlackRock 抢占先机。节目认为,这件事清楚说明创始人的纯粹性很重要,但公司要继续扩张,也需要新一代管理者的灵活性。 🧑‍🤝‍🧑 Bogleheads:金融世界的草根信仰 Jack 被第二次请出董事会后,Vanguard 并没有与他彻底切割,而是保留他的研究中心和精神领袖地位。与此同时,投资者社区自发形成了 Bogleheads 运动,把低成本、长期持有、简单资产配置变成一种近乎信仰的投资文化。 “Saint Jack。” 🔥 金融危机成了 Vanguard 最好的营销 2008 年金融危机中,被动指数基金当然也跟着市场下跌,但主动管理人并没有像承诺中那样保护投资者。华尔街“聪明钱”的光环破灭,而 Vanguard 因为低费率、不以盈利为目标、站在普通投资者一边,获得巨大信任红利。 “Vanguard 明确给你的一个承诺是:我们不会从你身上赚钱。” 🧩 今天的新挑战:Vanguard 模式是否开始限制 Vanguard? Vanguard 的低利润、共同所有制结构让它能极致降费,但也带来技术、客服和客户关系上的短板。许多用户在 Fidelity 等券商平台上持有 Vanguard ETF,客户关系并不在 Vanguard 手里。BlackRock 则借 iShares 在 ETF 市场大幅领先。节目最后提出一个反直觉问题:过去让 Vanguard 成功的结构,今天会不会也成为它扩展新业务的限制? 🏦 私人资产与下一个 Vanguard Effect Vanguard 正在尝试进入 private equity 等私人资产领域。主持人讨论,公开市场基金的费用已经被 Vanguard Effect 大幅压低,但 VC 和 PE 仍然普遍是“2 + 20”的高收费结构。问题是,私人市场是 access 生意,资产会选择投资人,最优秀的管理人未必愿意放弃高费用。因此 Vanguard 能否把低费用革命带入私人市场,仍是一个巨大悬念。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

214分钟
99+
1个月前
#544. HTML 是新的 Markdown:用AI生成动态 Spec

#544. HTML 是新的 Markdown:用AI生成动态 Spec

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:AI 工具实践播客《How I AI》Why this Claude Code engineer uses HTML files as AI specs | Thariq Shihipar (Anthropic) 本期节目来自 Anthropic 的 Code with Claude 开发者大会现场。主持人 Clara Vo 邀请参与 Claude Code 工作的 Thariq Shihipar,讨论一个正在悄悄改变 AI 编程工作流的趋势:HTML 正在成为人与 Agent 协作的新型文档格式。 过去,很多人用 Markdown 写 PRD、spec、实现计划,再交给 AI 执行。但随着 Agent 可以运行更久、处理更复杂的任务,计划文档越来越长,人类反而越来越不愿意读。Thariq 提出,真正的问题不是 Agent 能不能读 Markdown,而是人类是否还能深度参与其中。HTML 因为可以承载视觉化 mockup、交互式界面、代码片段、设计系统和验证标准,正在成为更适合人类和 Claude 共同理解、共同修改、共同推进工作的媒介。 这期节目不仅讨论“HTML 是新的 Markdown”,还展示了 Claude Code 如何生成 HTML brainstorm、HTML 实现计划、一次性 micro app、living design system,以及团队状态更新。它本质上是一堂关于 AI 时代产品经理、工程师和创作者如何重新设计文档、计划与协作界面的实战课。 👨‍💻 本期嘉宾 Thariq Shihipar,Anthropic 成员,参与 Claude Code 相关工作。他长期探索人和 AI Agent 的协作方式,尤其关注如何通过更好的界面、计划、文档和验证机制,让人类在 Agent 工作流中保持深度参与。 ⏱️ 时间戳 00:00 开场 & 播客简介 HTML 是新的 Markdown 01:33 核心观点预告:Markdown 计划太长,人类已经不读了 03:08 Code with Claude 现场:为什么说 HTML 是新的 Markdown 03:27 从 Markdown 到 HTML:Agent 计划变长之后,人类参与度下降 04:52 PRD、spec 和计划为什么仍然重要 AI 时代的新角色:算力分配者 05:11 当 Claude 跑八小时,意味着它可能花掉五百美元 06:00 产品经理没有消失,而是在变成 compute allocator 06:54 和 Agent 保持同步:不是被 AI 管理,而是共同对齐目标 用 HTML 做 Brainstorm 和计划 07:19 Claude Code 现场演示:用 HTML 生成 demo 想法 08:03 从 ASCII wireframe 到视觉化 brainstorm 08:53 一屏读不完就不会读:为什么 HTML 更容易让人投入 10:01 把想法推进成 HTML 实现计划 11:08 Prompt 不需要复杂:让 Claude 自己决定最佳表达形式 12:04 好 prompt 的平衡:给足信息,但不要限制 Claude 12:54 “我相信你”:开放式信任如何改善模型输出 未来的 PRD、Spec 与验证标准 13:26 PRD 的未来:按项目和受众定制的 spec package 14:37 在哪里介入 Agent 工作流:type interface、边界与决策点 15:21 不只写需求,还要写验证标准和测试方法 16:13 测试验证不等于测试:rubric、视频展示和 Outcomes 一次性 Micro App:为一个问题生成一个界面 16:31 Markdown 易编辑的反对意见:HTML 怎么改? 17:22 让 Claude 为具体决策生成可编辑 HTML artifact 18:47 微型软件:从 HTML 计划里拆出一个模块,生成专属编辑 UI 19:57 这是未来的个人协作方式,还是团队协作方式? 团队协作、即时文档与软件丰裕时代 20:26 把 HTML 计划发给同事:被阅读的概率高一百倍 21:02 用 HTML 周报向经理同步工作状态 21:28 软件 Jevons 效应:便宜的 token 带来更多临时工具和漂亮界面 22:07 即时文档与一次性软件:当创作和查找成本接近零 23:43 把 HTML 计划作为实现和验证依据 Living Design System:可运行的设计文档 24:17 用 HTML 表达 design system,而不是 Design.md 25:22 高级用法:组件可视化页面、营销素材和真实 App 截图 26:50 Component variations:用 knobs 和 sliders 探索设计变化 27:35 在计划里加入评论、圈选和审阅交互 28:18 把 spec 做成轻量 Figma dashboard 实操总结与快问快答 28:35 实操流程总结:HTML brainstorm、HTML plan、micro app、design system 29:48 最喜欢 Claude Desktop 哪个 tab?答案是 Code 30:07 Code with Claude 最兴奋的发布:SpaceX 合作与 orbital data centers 31:08 当 Claude 不听话怎么办:不要吼,保持友好和清晰 32:34 如何找到 Thariq:X 账号 @TQ212 🌟 精彩内容 💡 HTML 是新的 Markdown Thariq 认为,Markdown 曾经非常适合和 Agent 协作,因为它简单、可读、可编辑。但当 Agent 的任务越来越长、计划越来越复杂,Markdown 文档会变成一千行以上的长文件,人类反而不再阅读。HTML 的优势不只是模型能读,而是人类更愿意读、更容易理解,也更容易参与修改。 “HTML 读起来容易得多。所以它成了你和 Claude 之间更丰富的沟通媒介。” 🧠 人类仍然必须深度参与计划 节目反复强调,AI 越强,PRD、spec 和计划反而越重要。因为让 Claude 长时间运行并不是免费的,它消耗的是 token、时间和金钱。人类的新职责,是决定哪些事情值得让 AI 去做,哪些问题需要先想清楚。 “如果你要花五百美元,那我们现在其实都在变成 compute allocator,也就是算力分配者。” 🛠️ 用 HTML 生成可读的实现计划 Thariq 展示了如何让 Claude Code 先用 HTML brainstorm demo 想法,再把选中的想法扩展成一个完整的 HTML 实现计划。这个计划里可以包括 mockup、代码摘录、文件结构、mood board、逻辑说明和执行步骤。相比一份长 Markdown,这样的计划更像一个小型网页,人类更愿意真正读完并参与。 “这就是计划。它完全是 HTML。这个东西我真的会读。” 🎮 一次性 Micro App:为一个决策生成一个界面 当 Thariq 不喜欢 HTML 计划里某个具体规则表时,他没有回到终端里用文字来回修改,而是让 Claude 为这个问题生成一个专属可编辑界面。这个界面可以修改字段、隐藏内容、添加规则,并把结果导出成 Markdown 再放回计划中。Clara 将其称为“微型软件”,甚至是叠在微型软件之上的微型软件。 “这甚至都不是个人软件了。它更小,是微型软件。” 📄 即时文档和一次性软件的时代 当生成文档、生成界面、生成工具的成本大幅下降后,团队不一定再需要为所有内容强行套用同一个模板。计划可以是 HTML,周报可以是 HTML,设计系统也可以是 HTML。重点从“文档放在哪里、格式是否统一”,转向“这个计划是否清楚、是否有助于判断和执行”。 “因为它很便宜,所以用完就可以扔掉。” 🎨 Living Design System:Design.html 万岁 Thariq 和 Clara 都分享了把 design system 做成 HTML artifact 的做法。它不仅可以展示颜色、字体、间距和组件,还能让 Claude 在不同项目中引用同一套设计语言。Clara 还提到,可以为营销团队生成组件可视化页面,让他们直接下载真实 App 风格的透明 PNG,用于 deck、视频或宣传素材。 “Design.md 已经死了。Design.html 万岁。” ✅ 测试验证不等于测试 节目中还提到,AI 时代的验证不只等于传统 unit test。验证可以是一套 rubric,可以是一组 synthetic data,也可以是让 Claude 展示它完成了什么。对于产品经理来说,未来不仅要写功能需求,还要更清楚地定义成功标准、验证方式和边界条件。 “测试验证不等于测试。” 🤝 对 Claude 友好一点 在快问快答中,Clara 问 Thariq 当 Claude 不听话时会不会吼它。Thariq 表示不会。他更倾向于用友好、清晰的方式和模型沟通,因为他希望未来存在这样一种协作方式:你对模型更友好、更有建设性,它也能给出更好的结果。 “我更希望这样一种情况存在:你对 Claude 友好一点、客气一点,就能得到更好的输出。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

33分钟
99+
1个月前
#543. 为何 2026 是 Harness 之年?IBM 专家深度拆解

#543. 为何 2026 是 Harness 之年?IBM 专家深度拆解

跨国串门儿计划

📝 本期播客简介 本期我们克隆了全球 AI 开发者大会上的一场高能演讲 Harnesses in AI: A Deep Dive — Tejas Kumar, IBM 主讲人是 IBM 的 AI 开发者倡导者 Tejas Kumar。当整个行业都在疯狂调优 prompt 时,他却一针见血地指出:真正的解法在于给 AI Agent 套上一副“缰绳”——Harness。通过一个干净利落的 Live Demo,Tejas 展示了一个会撒谎、常崩溃的残血版 Agent,如何在不修改一行 prompt 的情况下,仅靠加上层层护栏、验证和自动化处理器,就稳如磐石地完成任务。他更抛出一个大胆判断:2025 是 Agent 之年,2026 必将属于 Harness,并畅想了“动态即时 Harness”这一通往 AGI 的下一步。这期节目不聊虚的,全是软件工程硬货。 👨‍⚕️ 本期嘉宾 Tejas Kumar,IBM 的 AI 开发者倡导者,曾在多家前沿科技团队摸爬滚打,如今专注于一个课题:让 AI 系统真正可控、可依赖。他擅长将复杂理念用最直观的代码展现在你面前。 ⏱️ 时间戳 00:00 主播开场:本期克隆简介与金句预告 登山者的安全带与 AI 的缰绳 01:32 演讲开场:Tejas 自我介绍,抛出“Harness”这个贯穿始终的词 02:48 核心痛点:我们都在为别人的黑盒模型付租金,可靠性是唯一解药 04:35 到底什么是 Agent Harness?——工具注册、上下文压缩、护栏、循环与验证的五合一 Live Demo:从零驯服一个会撒谎的 Agent 07:10 任务来了:用古董级 GPT-3.5 去 Hacker News 点赞,且绝不碰 prompt 09:20 首次翻车:Agent 没干成,却大言不惭地说自己成功了 10:45 第一层加固:给 Agent 套上护栏——限制步数,自动压缩上下文 12:30 代码“手术”:把一团逻辑提炼为独立的 Harness 模块 13:40 真相模块:加入确定性的验证函数,检查工具历史,彻底杜绝撒谎 15:20 终极障碍:遇到登录页怎么办?Harness 自己注入凭证,瞬间通关 17:00 功德圆满:零 Prompt 修改,成功点赞,Harness 的威力尽显 总结与前瞻 18:10 全场最响金句:“我一次都没动过 prompt”,一切改变来自 Harness 19:02 趋势预测:2025 Agent 之年,2026 Harness 之年,2027 动态即时 Harness 之年 20:23 IBM 在干嘛?Open Rag 项目用超级 Harness 为企业内部 RAG 加装安全锁 21:00 致谢与畅想:动态 self-harness 或许是通向 AGI 的下一个台阶 🌟 精彩内容 🪢 一个比喻点透 Harness Tejas 的类比精妙至极:登山者靠安全带把自己固定在稳定的山体上,遛狗的人用背带防止狗乱窜——AI Harness 做的正是同一件事:把飘忽不定的大模型,牢牢锚定在你完全可控的代码环境里。跟模型本身牛不牛没关系,只关乎你给不给它拴上绳子。 🛠️ Prompt 一碰没碰,Agent 脱胎换骨 整场 Demo 中,Tejas 说到做到,连系统 prompt 都没改一个字。他靠的是传统软件工程的看家本领:加护栏防止失控,写验证函数打假,再用自动登录器填坑。结果?同一个老模型,从不靠谱的骗子变成了指哪打哪的标兵。Harness 不是花招,是工程正道。 🤖 2025 风头正劲的是 Agent,但下个爆点属于 Harness Tejas 说得很直白:“二零二五年是 Agent 之年,那么二零二六年就是 harness 之年。”他更往前一步,描绘了让 Agent 在执行任务前先为自己生成一个 Harness 的未来,那将是具备自我意识的“动态即时 Harness”。他相信,这是 AGI 逻辑链上不可或缺的一环。 🏢 不是玩具,是铠甲:IBM Open Rag 的 Harness 实践 在 IBM,Tejas 和团队打造的开源项目 Open Rag,处理的是企业最敏感的内部数据——Teams 通话、发票、PDF。支撑其企业级安全的不是魔法,而是一套工程深厚的 Harness。它证明了 Harness 不仅仅是 Demo 里的技巧,更是大厂真金白银投入的方向。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

21分钟
1k+
1个月前
#542. 社交连接的幸福科学:为什么我们总低估他人的善意?

#542. 社交连接的幸福科学:为什么我们总低估他人的善意?

跨国串门儿计划

📝 本期播客简介 本期我们克隆的是知名播客《Huberman Lab》How to Overcome Social Anxiety | Dr. Nick Epley 由斯坦福医学院神经生物学教授 Andrew Huberman 主持,嘉宾是芝加哥大学布斯商学院行为科学教授 Nick Epley 博士。Nick 是社会连接领域的顶尖专家,其新书《A Little More Social》分享了如何通过日常小选择带来意想不到的幸福与健康。在这场对话中,你将听到人类对他人心智的解读机制、声音与眼神隐藏的力量、为什么独处会伤害我们、以及如何用特定的暴露疗法克服社交焦虑。Nick 本人也动情讲述了他如何凭借研究数据的勇气领养一位患有唐氏综合征的女儿,以及一次主动的问候如何转化为多年友谊。这不仅是关于“多与人交谈”的建议,更是一次关于人性本质、爱、勇气与微小习惯如何重塑人生的深度启迪。 👨‍‍🔬 本期嘉宾 Nick Epley 博士,芝加哥大学布斯商学院行为科学教授,社会认知与连接领域的权威研究者。他的研究被《纽约时报》《华尔街日报》等广泛报道,新书《A Little More Social: How Small Choices Create Unexpected Happiness, Health, and Connection》即将出版。 ⏱️ 时间戳 开场与嘉宾介绍 00:00 节目介绍与嘉宾背景 01:29 欢迎 Nick Epley 破解心智的秘密:眼神、声音与思考 01:29 心理理论:人类如何推断他人意图 09:32 声音的魔力:为什么语音比文字更显人性与智慧 19:23 视频、语音、文字——不同媒介如何左右我们对人的判断 27:48 独处的代价:社交隔离如何伤害幸福感 34:07 远程作用:我们渴望在外部世界留下回响 41:18 对话的艺术:“响应性”为何让交流令人愉悦 社会连接的根本:合作与超越血缘的爱 43:23 协调与合作:社会连接的核心功能 45:10 非亲属之爱:领养孩子与“镜中自我” 打破社交焦虑:从实验室到真实世界 01:15:22 暴露疗法:如何用真实互动改写恐惧信念 01:17:57 Gia的100天拒绝挑战:善意远多于拒绝 01:29:54 怎样避免“粘人”:把握社交的尺度 01:37:16 寻找线下连接:教堂、音乐节与日常契机 爱与家庭的连接故事 01:39:06 领养唐氏女儿:数据驱动的勇气与意想不到的祝福 01:52:02 接纳孩子本来的样子 01:59:01 麋鹿营地的友谊:一次主动问候开启的多年缘分 习惯的力量:塑造积极的社交人生 02:06:19 以身作则:年长者的示范责任 02:11:44 “打招呼步行”:小习惯如何点亮每一天 结尾 02:17:49 感谢与 Nick Epley 新书《A Little More Social》 🌟 精彩内容 💡 低估的善意:Gia的100天拒绝疗法 Gia Giannini 曾极度害怕被拒绝,于是开启了一项为期100天的挑战:每天向陌生人提出荒唐请求,例如在 Krispy Kreme 要求制作奥运五环甜甜圈、在自家后院踢足球、在飞机上广播等。他以为会遭遇99%的拒绝,结果被接受的次数(51次)竟然超过了被拒绝的次数(48次),且几乎没有任何恶意回应。这次经历彻底改变了他对人类善意的认知,也证明我们的社交恐惧常常是建立在对他人过度悲观的错估之上。 🗣 声音是心智的窗户 在一项实验中,人们通过视频、纯音频、文字稿或书面解释来评价政治人物的思考深度与人性。结果发现,只要听到声音,即便是反对派,也被评价为更理性、更聪明,而那些只能阅读文字的人更容易将对方“去人性化”。声音中的语调、节奏和停顿传递出“活跃的思维”,这种信息在纯文字中大量丢失。 👨‍‍👩‍‍👧‍ 数据驱动的勇气:领养唐氏女儿 当妻子提议领养一名唐氏综合征孩子时,Nick 陷入了常见的恐惧与不确定。但他回想起自己研究积累的成千上万数据点都指向一个事实:人们主动伸出援手时,结果往往比预想的好得多。这种“数据驱动的勇气”让他迈出一步,最终领养了来自中国的 Lindsay。Lindsay 成为家庭的“磁铁”,用毫无保留的“Hi”感染了每一个人,让 Nick 见证了超越智识障碍的深刻连接。 🦌 麋鹿营地的启示 在俄勒冈野外,Nick 和儿子本遇到一队陌生猎人。本本能地想要避开,但 Nick 选择主动打招呼。结果对方不仅分享了多年的狩猎经验,还邀请他们到帐篷共进晚餐,甚至拿出红酒招待。这次偶遇发展成持续的友谊,猎友至今仍发短信提醒他们申请狩猎许可。一次主动的连接,为父子旅行增添了远超预期的温暖。 🚶 从“打招呼步行”开始的改变 Nick 改变自己的第一个小习惯是“打招呼步行”:从办公楼门口到办公室的路上,他不再低头匆匆走过,而是微笑着和每位路过的同事、保安、清洁工打招呼。这个微小的例行程序让他的心情显著变好,也示范了如何通过刻意练习将积极的社交行为内化为性格的一部分。 🌐 播客信息补充 翻译克隆自:《Huberman Lab》 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

140分钟
1k+
1个月前
#541. 为何人工智能即将吞噬硬件

#541. 为何人工智能即将吞噬硬件

跨国串门儿计划

📝 本期播客简介 本期我们克隆了硅谷顶尖创投播客《Lenny's Podcast》Why AI is about to eat hardware | Caitlin Kalinowski (ex–OpenAI, Meta, Apple) 主持人 Lenny Rachitsky 与硬件领域传奇人物 Caitlin Kalinowski 进行了一场深度对谈。Caitlin 曾在苹果参与 MacBook Air 与 Mac Pro 的设计,在 Meta 领导 VR 硬件团队,并曾在 OpenAI 从零开始建立机器人与硬件部门。她是硅谷最受追捧的硬件专家之一,亲历了消费电子、AR/VR、机器人和 AI 硬件的发展浪潮。在这期节目中,她将揭示 VR 为何未能成为主流却又如何为机器人时代铺路、硬件开发的血泪法则、供应链的致命脆弱点、AI 如何改变工程设计,以及她对未来战争与家用机器人的冷峻预判。无论你是硬件从业者、AI 爱好者,还是对未来科技充满好奇,这都是一堂不可错过的硬核公开课。 👨‍⚕️ 本期嘉宾 Caitlin Kalinowski,硬件工程领袖,曾任 OpenAI 机器人与硬件部门负责人,Meta VR/AR 硬件团队负责人,苹果 MacBook Air 及 Mac Pro 技术负责人。她是硅谷最知名的硬件布道者之一,多次从 0 到 1 搭建顶尖硬件团队,并致力于推动实体 AI 与机器人技术的发展。 ⏱️ 时间戳 00:00 开场介绍:克隆节目与嘉宾背景 VR 与 AR 的兴衰:技术弧线上的垫脚石 04:24 VR 为何没能改变世界:社交障碍与面罩困境 06:36 AR 眼镜的未来:从 Orion 到全天候显示屏 08:03 VR 技术的意外遗产:正为机器人时代铺平道路 硬件开发到底有多难 10:16 硬件“编译”只有五次:量产前无法像软件一样迭代 12:11 为什么硬件工程师必须保守:公差、良率与百万量级 15:37 机器人时代来临:键盘前的 AI 终将饱和,下一前沿是物理世界 17:12 供应链致命点:一颗磁铁如何卡住整个机器人产业 19:20 战争驱动的创新:无人机、航空母舰与重新工业化的紧迫 AI 安全与实体世界的碰撞 22:41 机器人被“越狱”的恐怖想象:prompt injection 在物理世界的后果 23:53 OpenClaw 乌龙:AI 代理如何轻易泄露隐私 苹果和 Meta 的硬件管理心法 25:40 苹果的“柜子背面”哲学:每个细节都是对目标的极致忠诚 29:24 案例:Quest 2 如何通过砍功能、降成本来成就爆款 30:33 硬件开发四大原则:目标明确、先啃难点、聚焦触控、立即行动 34:27 像 Elon 一样量化权衡:一克重量的价值是多少? 供应链风暴与内存危机 39:30 “存储价格”陨石袭来:AI 吞噬内存,硬件公司如何求生 41:38 价格翻倍、六倍飙升?内存短缺背后的深层逻辑 43:47 一个扫地机器人有上千个组件,缺一颗螺丝就全线停摆 45:48 垂直整合:特斯拉和 Starlink 的供应链护城河 AI 闯入硬件设计 48:06 CAD 的 AI 化还处于襁褓:为什么 LLM 不懂摩擦力? 51:08 PCB 布线已成 AI 练兵场,但真正的革命需要“世界模型” 53:02 人形机器人不是万能答案:为什么工厂里不需要“仿人机器” 55:23 数据即壁垒:谁拥有三维 CAD,谁就拥有了未来? 五年展望:家用、战争与人类的位置 1:03:10 五年内,你会在街上看到更多怪东西,但家用机器人尚早 1:06:03 战争变化将远超消费电子:无人机正在重塑军事逻辑 离开 OpenAI 与领导力反思 1:06:32 为何离开 OpenAI:当价值观与管理决策发生冲突 1:08:40 招聘新规则:通才、专才与“AI 原生代”同样珍贵 1:11:51 反驳 AI 消灭初级岗位:我们比任何时候都更需要二十岁的年轻人 传奇领袖的启示 1:13:47 从乔布斯、扎克伯格到奥特曼:想得不够大、标准永不妥协、决策下放 1:16:17 失败教会我的事:Quest One 摄像头公差的惨痛翻车故事 闪电问答 1:20:54 最近推荐的书:《新日之书》《达洛维夫人》《历史》 1:22:02 最爱的影视:《亢奋》 1:22:39 最酷的产品:Vollebak 材料科学服装 1:23:01 人生格言:过去与未来都是分支,只有当下可选择 1:24:02 为何雇博士学古典:从约瑟夫·布罗茨基书单谈起 🌟 精彩内容 💡 VR 是机器人时代的垫脚石 Caitlin 指出,VR 虽然在消费市场未能大爆发,但它解决了空间定位、SLAM、深度传感器等关键问题,这些技术如今正被广泛应用于机器人、自动驾驶和制造业。这意味着那些在 VR 上投入巨资的公司,已经在下一波物理 AI 浪潮中抢占了先机。 “我把 VR 看作是漫长技术演进弧线上的一步……所有这些技术都在被机器人领域使用。” 💡 硬件只能“编译”五次 与软件不同,硬件项目从设计到量产通常只能经历寥寥几次大的迭代。一旦最终定型并量产,就无法再像软件那样推送更新。这种极强的约束迫使硬件工程师必须极度保守,在过程中进行更多的可靠性测试和冗余设计。 “做硬件的话,每次大改版你都得在 CAD 里重新设计,然后发布。到量产那最后一次,就定稿了。” 💡 供应链的致命脆弱:从磁铁到内存 从机器人执行器里的磁铁,到所有智能设备都依赖的内存,供应链的中断可能瞬间摧毁一个产品。Caitlin 分享了新冠疫情期间的采购教训,并警告当前 AI 热潮下内存价格可能飙升,建议硬件公司提前囤货。她还提出了重新工业化以确保国家安全的主张。 “如果我们拿不到磁铁,那就得设计新型的 Actuator……这很基础。而内存价格正在像陨石一样砸向整个消费硬件和机器人行业。” 💡 招聘“AI 原生代” 在组建顶级硬件和机器人团队时,Caitlin 特别强调了要寻找那些在二十岁左右、完全原生地使用 AI 工具的新型人才。他们解决问题的方式与以往完全不同,速度更快,是教导整个团队拥抱 AI 的关键。 “真正 AI 原生的人……基本都在二十岁、二十一岁左右……我们需要这些人来教我们怎么思考。” 💡 乔布斯的“想得不够大”与奥特曼的“为什么不是一万倍” Caitlin 分享了与三位传奇创始人共事的心得:乔布斯从不降低对卓越的标准,扎克伯格将决策下放到最低层级并保持极高效率,而奥特曼则习惯用庞大数字推动团队跳出局限。 “Sam 特别擅长问:为什么不更多?为什么不是一百倍或一万倍?你想得太小了。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

87分钟
2k+
1个月前
#542.写作大师Dean Koontz:放弃提纲、信任角色,五亿册背后的珊瑚礁写作法

#542.写作大师Dean Koontz:放弃提纲、信任角色,五亿册背后的珊瑚礁写作法

跨国串门儿计划

📝 本期播客简介 本期我们克隆的是知名写作播客《How I Write》Storytelling Mastery in 107 Minutes — Dean Koontz 主持人是备受关注的写作导师 David Perell。他深入美国惊悚小说大师 Dean Koontz 的私人书房,带来一场关于创作灵魂的深度对谈。Dean Koontz 写过一百多本书,全球销量超过五亿册,却极度反感传统创作教条。在节目中,他毫无保留地分享了为什么必须放弃提纲、如何让角色拥有自由意志、他那如珊瑚礁般一页一页打磨的独特写作方式,以及童年苦难如何成为他理解邪恶与塑造角色的源泉。这不仅是关于写作技艺的大师课,更是一场关于生命神秘、信仰与美的哲学漫游。 👨‍🎨 本期嘉宾 Dean Koontz,美国惊悚小说大师,著有《Odd Thomas》《Intensity》《Lightning》等众多畅销书,作品全球销量超过五亿册,以其独特的角色驱动写作方式和对英语语言的极致追求著称。 主持人 David Perell,写作导师、知名播客《How I Write》主持人,致力于探索顶尖作家的创作心法。 ⏱️ 时间戳 00:00 开场:Yikai介绍本期克隆播客及嘉宾Dean Koontz 01:23 David Perell在Dean Koontz的书房开启对话 放弃提纲,信任角色 02:02 行业惯例 vs 创作自由:为什么提纲会限制好点子的诞生 03:28 赋予角色自由意志:让他们带你去意想不到的地方 04:33 信任角色的时刻:当角色自己说话时,你就知道路子对了 珊瑚礁般的写作方式与自我怀疑 05:57 独特的写作方式:一页改二十遍,直到完美再动下一页 06:33 自我怀疑是工具:所有的写作障碍都是自我怀疑 09:02 挑战:为智商75的主角创造一套独特的语言 13:48 钟形曲线左端的智慧:简单中的深刻 14:45 反抗“常识”:《Lightning》的出版风波,坚持自我风格 寻找声音,发挥天赋 19:22 从科幻到悬疑喜剧的转型历程 22:27 生活中的神秘指引:那些无法解释的巧合 27:25 将绘画的渴望化为文字的生动 28:20 才能是礼物,责任是把它用到极致 灵感与角色的诞生 28:58 一首歌催生一本小说:《Life Expectancy》的灵感瞬间 32:36 Odd Thomas 的意外降生:一句突然冒出的开场白 33:56 自律源于热爱:只喜欢写作的过程 35:06 父亲的原型:如何钻进反社会者的脑子 42:09 童年的羞辱:转化为同理心与创作深度 44:11 普通人的非凡:圣经人物与 Dean 笔下的角色 编辑、语言与悬念 45:24 编辑方向:文笔的流畅性与生动 47:23 超越海明威:保留英语的诗意,反对过度简化 52:49 悬念的核心:让读者在乎角色 59:46 案例《Intensity》:道德抉择如何制造悬念 01:01:03 单一视角原则:活在角色里,而非操控木偶 01:04:06 隐喻的力量:比形容词更高效地塑造情绪 信仰、自我怀疑与写作障碍 01:04:46 科学与信仰:量子力学中看见的创造世界 01:09:08 所有的写作障碍都是自我怀疑:如何与怀疑共存 大师的馈赠 01:11:13 John D. MacDonald:让人物和情节一样有趣 01:13:05 T.S. Eliot:震撼的语言与对世界的接纳 01:15:45 Ray Bradbury:用喜悦写作,让语言绚烂而不失控 01:19:48 狄更斯:不怕流露真情,区分真情与滥情 美学、环境与终极墨水 01:24:16 平淡无奇正摧毁灵魂:艺术与美的救赎 01:24:54 日式与Art Deco:美如何带来内心平静 01:27:17 形而上学是笔中的墨水:生命必有奥秘,才有书可写 01:32:09 结尾:David感谢Dean,访谈结束 🌟 精彩内容 💡 放弃提纲,把方向盘交给角色 Dean Koontz 坦言,他职业生涯的转折点就是停止写提纲,转而让角色驱动故事。“如果你死守提纲,产出的书质量肯定不如你放手让创造力流淌来得好。”他相信角色拥有自由意志,当你信任他们,他们会引领你走向完全意想不到、却更精彩的境地。“我常被角色说出的台词逗笑,那一刻我就知道路子对了。”这种方法不仅解放了他的创造力,更诞生了像 Odd Thomas 这样的经典角色。 🛠️ 珊瑚礁写作法:每天在自我怀疑中打磨 与大多数作家不同,Dean 从不多次起草整本书。他是一页一页地推进,每一页都要修改二三十遍,直到他无法再改动为止。“我推进一本书,就像珊瑚礁是由无数微小生物的遗骸一点一点累积而成那样。”同时,他将自我怀疑视为一种工具:“所有的写作障碍都是自我怀疑。你不应该害怕它。”正是这种极度缓慢又自律的方式,让他能够品控每一句话,最终用文字构建出令五亿读者着迷的世界。 🎨 语言的炼金术:隐喻、诗意与真情 Dean 深爱英语这门语言。他反对盲目追随海明威式的简化,主张运用所有修辞工具让文字歌唱。“当我大量使用隐喻的时候,一开始遭到了负面反应,但读者最强烈的反应之一,恰恰是那种用上所有语言工具的文字。”他强调,隐喻必须服务于场景的情绪和角色的视角,而非炫技。同时,他区分了真情(sentiment)与滥情(sentimentality),认为真正的文学应该敢于打动人心,正如狄更斯那样,让读者泪流满面。 ❤️ 苦难的价值与创作的源泉 成长于一个充满暴力、酗酒和羞辱的家庭,Dean 的经历痛苦却深刻。他将反社会人格的父亲视为理解邪恶的“礼物”。“你必须走出来,否则那个混蛋就赢了。”这种态度不仅塑造了他笔下众多复杂的反派,也让他对生活中的神秘与美抱有极大的敬畏。他认为,如果生命没有奥秘,作家便只有一本书可写。“形而上学是我笔中的墨水。每个生命、每个角色的人生,都是一场朝向某种有意义之物的伟大冒险。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

92分钟
99+
1个月前
#540.AI Agent 的达尔文时刻:技术重构、多模型博弈与未来软件三分天下

#540.AI Agent 的达尔文时刻:技术重构、多模型博弈与未来软件三分天下

跨国串门儿计划

📝 本期播客简介 本期我们克隆了全球知名科技播客《Cognitive Revolution》Three Kinds of Software Survive: Tasklet's Andrew Lee on Competing to be a Horizontal Platform 主持人 Nathan Labenz 与 Tasklet 创始人兼 CEO Andrew Lee 进行了一场深刻坦诚的对话。这是 Andrew 第四次做客节目,他依然坚持“速度是唯一的护城河”,并毫无保留地分享了 Tasklet 过去六个月如何将整个产品技术栈彻底推倒重写。你将听到他们怎样用文件系统取代无限增长的长聊天记录,重新发明上下文管理以大幅降低 token 成本。Andrew 还首次袒露了从几乎 all-in Anthropic 到果断拥抱多模型平台的心路历程,也直言不讳地讨论了与模型供应商之间既合作又竞争的微妙舞蹈,更抛出一个惊人的预测:未来只有三类软件公司能活下来。这不仅是一场关于 AI Agent 平台前沿技术的第一手分享,也是关于如何在极速变化的赛道中思考护城河与商业模式的战略大师课。 👨‍⚕️ 本期嘉宾 Andrew Lee,通用 AI Agent 平台 Tasklet 的创始人兼 CEO。他曾是数据库创业者,坚信速度是唯一护城河。过去半年,他带队将 Tasklet 从专注工作流自动化完全转向通用的、取代知识工作者所有 SaaS 的横向 Agent 平台,并正在将 OpenAI、Google、开源模型等全部纳入 Harness,目标是成为企业中立、多模型的 AI 超级机甲。 ⏱️ 时间戳 00:00 开场 & 播客简介 六个月推翻所有代码 04:12 被迫转型:用户想要的不是工作流,而是同步对话的通用 Agent 09:01 上下文管理革命:把历史放进文件系统,发送给 LLM 的只需是提示 10:20 分桶压缩与缓存:如何在数万次自动触发中不破产 14:59 跨用户缓存潜力与多模型序幕 从 Claude 信徒到多模型平台 16:01 Opus 4.5/4.6 的突破与拒绝 4.7 的成本账 18:14 GPT-5.5 赶上来了,为什么 Kimi、DeepSeek 也值得认真对待 19:51 残酷的供应商竞合:Max 订阅吸走了 80% 流失用户,Anthropic 正补贴从我们这里离开的人 23:30 中立的魔力:给任何模型“穿上机甲”,替企业押注所有人 30:26 重新定义 Harness:不是限制模型的缰绳,是让它征服世界的机甲 33:16 用小模型调度大模型:借鉴 Anthropic Supervisor Agent 的省钱哲学 36:23 多模型 Harness 的挑战:为不同缓存 API 编写不同代码 44:33 模型的趋同与变数:大实验室互相偷师,新玩家可能从斜刺里杀出 构建共享大脑与终极软件格局 53:18 组织、团队、Agent 三层上下文:Tasklet 的第二大脑计划 01:04:02 未来仅存三类公司:横向平台、Headless API、解决方案公司 01:06:56 赢得企业信任:回滚、审核与版本控制如何让 Agent 进入关键业务 快速问答与幕后趣闻 01:09:54 推荐供应商:Black Salt、Firecrawl;内部 Token 支出仅占人力成本 5‑10% 01:13:57 对 Mythos 的谨慎:没摸到的东西很难兴奋 01:15:35 扎克伯格会打电话吗?Manus 收购被中国否决后的花絮 🌟 精彩内容 💡 六个月,全部推倒重来 Andrew 透露,用户的需求迫使他们从工作流自动化彻底转向一个能同步对话的通用 Agent。这导致了整个产品、架构、甚至底层假设的重写。他用一句话概括:“过去六个月里,基本上每一行代码可能都被动过了,我们大多数基础假设都被推翻了。” 🛠️ 文件系统拯救 Agent 的上下文 为了解决无限聊天历史带来的成本崩溃,Tasklet 创造性地把历史状态移入文件系统,实际发送给 LLM 的只是精心设计的提示。这不仅能无限扩展,还搭配了按时间分桶的智能压缩,让自动触发一年的 Agent 依然记得最初的指令。“我们真正需要的是一个保存你历史的文件系统,然后实际发送给 LLM 的只是提示。” 🚀 给模型“穿上机甲”,而不是套上缰绳 Andrew 重新定义了 Harness 的角色:它不应该只是控制模型的缰绳,而应该是一套增强其能力的机甲。“我倾向于认为大家其实都在构建同样的东西。……Harness 更像是给它穿上机甲,让它能在真实世界里真正去做事。” ⚔️ 微妙的供应商战争与中立平台之策 面对 Anthropic Max 订阅近乎五倍以上的隐性补贴,Tasklet 80% 的流失用户直接去了第一方产品。Andrew 果断将 Tasklet 定位为中立的 AI 平台,替企业押注所有模型并优化选择。“押我们,等于押注所有人。我们会给你提供 Anthropic 的模型、OpenAI 的模型、Google 的模型……我们是纯粹的中立方。” 📉 终极预言:未来软件公司只会有三种 在对话尾声,Andrew 给出了一个大胆而清晰的预测:“我们想做的,就是成为那个取代知识工作者所有 SaaS 产品的 AI Agent 平台。”他认为最终只会剩下横向通用平台、纯 API 的 headless 公司,以及直接售卖结果的解决方案公司。像 Salesforce 这样的旧日巨头,将面临大幅萎缩。 🌐 播客信息补充 翻译克隆自:《Cognitive Revolution》 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

75分钟
2k+
1个月前
#539. 手搓AlphaGo:前DeepMind科学家拆解AI围棋核心原理,以及对LLM强化学习的深远启示

#539. 手搓AlphaGo:前DeepMind科学家拆解AI围棋核心原理,以及对LLM强化学习的深远启示

跨国串门儿计划

📝 本期播客简介 本期我们克隆了知名科技播客《Dwarkesh Patel 播客》的一期深度对谈 What rebuilding AlphaGo teaches us about self-play, RL, and future of LLMs - Eric Jang 主持人 Dwarkesh Patel 与嘉宾 Eric Jang 展开了一场精彩纷呈的技术深潜,从零开始重建了 AlphaGo 的思想宫殿。 Eric Jang 曾担任 1X Technologies 的 AI 副总裁,此前是谷歌 DeepMind Robotics 的高级研究科学家。他在休假期间做了一个让极客们热血沸腾的项目:用当今的开源工具和极低的预算,从头重建、改进并深入理解了 AlphaGo。在这期节目里,Eric 手把手地拆解了 AlphaGo 的核心组件——蒙特卡洛树搜索(MCTS)、策略网络与价值网络如何协同工作,以及为什么这套组合拳如此优雅且强大。但这远不止是一堂围棋 AI 历史课。Eric 更进一步,将 AlphaGo 的算法与现代 LLM 的强化学习进行了直接对比,深刻揭示了后者在方差、信用分配和样本效率上的根本困境,并展望了将搜索思想引入大模型推理的前景。此外,他还分享了自己用自动化 AI 辅助研究的实践经验,探讨了围棋作为“AI 科学家”孵化器的可能性。整期节目信息密度极高,从算法直觉到宏观哲学,将彻底刷新你对强化学习、搜索和智能本质的认知。 👨‍🔬 本期嘉宾 Eric Jang,前 1X Technologies AI 副总裁,前谷歌 DeepMind Robotics 高级研究科学家。他在机器人学习、深度强化学习领域有深厚积累。近期,他在休假期间独立完成了从头复现和改进 AlphaGo 的项目,并撰写了详细的技术教程,引发了社区广泛关注。他以对 alphaGo 核心机制的独到洞见,以及对自动化 AI 研究的先锋思考而闻名。 ⏱️ 时间戳 00:00 开场 & 播客简介 从零开始理解 AlphaGo 02:05 为何 AlphaGo 令人着迷:用一个神经网络摊销几乎不可解的搜索 03:43 围棋规则速通:从吃子到 Trump-Taylor 计分 08:38 搜索树与组合爆炸:361的300次方,比宇宙原子数还大 蒙特卡洛树搜索(MCTS)核心原理 11:16 UCB 与 PUCT:如何边建树边决定探索哪条路 15:59 价值函数登场:人类“一眼定输赢”的直觉,AI 也能拥有 21:02 策略网络:先猜一把哪儿值得搜,大幅剪枝 神经网络与搜索的完美联姻 24:54 MCTS 四步流程:选择、扩展、评估、回传 27:28 架构选择:为什么 ResNet 在小预算下仍优于 Transformer 34:23 初始化的魔力:先用人类棋谱教会模型什么是好棋 42:21 Self-play 闭环:让搜索反哺网络,实现策略迭代 强化学习的优雅与残酷对比 47:41 MCTS 作为改进算子:永远给你一个比当前策略更好的答案 52:00 知识蒸馏:把几千步搜索的成果内化到网络的一次前传里 57:04 价值函数训练技巧:小棋盘预训练与终局标签的重要性 01:03:01 深度震撼:10 层神经网络如何摊销 NP 难问题 01:11:35 对比 LLM RL:方差为何爆炸,“吸管里吸信号”的困境 01:22:21 MCTS 能直接用于 LLM 推理吗?广度、深度与动作空间的挑战 计算效率与自动化研究 01:28:41 算力缩放亲历:从千万美元到几千块,AlphaGo 变廉价了 01:38:08 Off-policy 训练与回放缓冲区:如何复用旧数据 01:47:04 信息论视角:监督学习每样本比特数远超 RL,软标签有多重要 01:55:36 围棋作为 AI 科学家孵化器:用外循环验证研究直觉 02:05:12 研究品味与可验证性:如何设计正确的 RL 环境 02:08:03 结尾 & 资源推荐 🌟 精彩内容 💡 10 层网络,摊销 NP 难题 Eric 指出 AlphaGo 最深远的贡献并非围棋本身,而是一个概念突破:区区 10 层神经网络,通过一次前向传播,就能以极高精度近似一个几乎不可解的深层搜索问题。这暗示了宏观特征可以瓦解我们对计算复杂度的传统认知,类似的现象也出现在 AlphaFold 等模型中。 “这是一个突破,我觉得今天大多数人都没能完全领会它有多么深远。” 🛠️ MCTS 的优雅:永远不用从 0% 开始 与今天 LLM 使用的朴素策略梯度方法不同,AlphaGo 的 MCTS 永远能基于当前状态给出一个改进后的策略标签。这意味着它的学习过程从未陷入“所有信号都是零”的荒漠,每一步都有明确的监督目标,从而实现了惊人的采样效率和稳定性。 “AlphaGo 之所以优雅,就是你永远不需要从一个 0% 的成功率开始,也不需要解决怎么拿到非零成功率的探索问题。” 🚀 监督学习信息效率完胜 Eric 与 Dwarkesh 从信息论角度对比了监督学习和 RL。在低 pass rate 区域,RL 每个样本只能提供极少的学习比特,而监督学习通过软标签(整个概率分布)可以提供高得多的信息量。这也解释了为何蒸馏如此强大——MCTS 的访问计数分布作为软目标,传递了远超单个动作标签的“暗知识”。 “在一个软标签里,每样本的信息量,以比特计,要大得多。这就是为什么蒸馏这么有效。” ⚖️ 成为第一,算力永远最贵 Eric 分享了自己仅用一万美元算力就重建 AlphaGo 的经历,对比当年 DeepMind 动辄百万美元的投入和定制 TPU 集群。他强调:“成为第一个做成一件事所需的算力,永远比后来追上来所需的算力大得多。”这个规律在 LLM 时代同样成立,先行者必须为探索未知付出巨大溢价。 🧪 围棋作为 AI 科学家的训练场 Eric 正在将围棋打造成一个“外循环”,用于训练自动化 AI 研究智能体。因为围棋验证快速、胜负明确,可以低成本地检验智能体提出假设、设计实验、解释结果的能力,最终有望迁移到更复杂的科学发现任务中。 “我搭建这个围棋环境的动机之一,就是觉得围棋承载了大量非常有趣的研究问题,而且验证速度很快。” 🌐 播客信息补充 翻译克隆自:《Dwarkesh Patel 播客》(Dwarkesh Patel Podcast) 本播客采用 AI 声纹克隆技术将原主持人和嘉宾的声音翻译成中文,可能听起来略有差异。 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

129分钟
1k+
1个月前
#538. Anthropic CFO深度对谈:算力命脉、指数思维与AI前沿的百亿美金赌注

#538. Anthropic CFO深度对谈:算力命脉、指数思维与AI前沿的百亿美金赌注

跨国串门儿计划

📝 本期播客简介 本期我们克隆了顶级投资播客《Invest Like the Best》Inside Anthropic's $100 Billion Al Compute Commitment | CFO Krishna Rao 主持人 Patrick O'Shaughnessy 与 Anthropic 首席财务官 Krishna Rao 展开了一场关于AI商业最前沿的深度对话。Krishna 揭开了Anthropic 百亿美金算力采购背后的决策逻辑,复盘了公司从90亿美元年营收暴增至300亿美元背后的指数级增长引擎,并坦率分享了内部文化、定价哲学以及与政府、投资者的微妙关系。这期节目不仅是一扇窥见AI实验室内部运作的窗口,更是一堂关于如何在指数时代进行商业思考的实战课。 👨‍⚕️ 本期嘉宾 Krishna Rao,Anthropic 首席财务官。他负责公司财务规划、算力采购、资本运作等核心职能,主导了与亚马逊、谷歌等云厂商总计数千亿美元的天价算力协议。在加入 Anthropic 前,他曾帮助 Airbnb 完成疫情期间的紧急融资,并拥有黑石集团私募股权背景。 ⏱️ 时间戳 00:00 开场 & 播客简介 算力即命脉 02:49 “我们采购的算力,就是公司业务的命脉” 03:19 为什么必须提前数年规划:算力无法即买即用 04:09 灵活性的三层内涵:使用三种不同芯片平台,自研调度层 06:06 从芯片层面构建编译器,实现对裸金属层的极致掌控 指数思维与不确定性之锥 06:22 “要停止线性思考,转用指数思维”——Krishna打破自身认知范式的转折点 07:08 如何用“不确定性之锥”推演未来,并瞄准结果范围的上限 07:34 分配给内部员工的算力本可换来数十亿美元收入,但选择长期主义 前沿智能的极高回报 08:47 公司有一条不会低于的算力基线,永远优先保证模型开发,因为前沿回报极高 11:02 模型迭代不仅能力跃升,token处理效率也乘数级提升 13:28 四个月内年营收从90亿跳涨至300亿,新模型不断解锁TAM 递归式自我改进与Scaling Laws 14:28 团队提出“递归式自我改进”概念:模型正自己构建下一代模型 15:10 内部超过90%的代码由Claude Code编写,其中很多代码又是Claude自己写的 19:22 “Scaling laws没有放缓,活力十足”——Krishna的明确判断 算力网络与消化能力 21:16 与XAI、SpaceX、Google、Broadcom等签订百亿、千亿级协议,层层叠加的算力蛋糕 24:45 如果明天空降十倍算力,能快速消化吗?——是的,因为已锤炼出高度可互换性 定价哲学与资本效率 31:18 为何收入暴涨而定价基本不动?降低Opus价格引发消费量爆发的杰文斯悖论 33:21 追求定价稳定性,同时用降价来释放价值,推动生态普及 34:01 整体计算回报率而非可变成本模型,才是衡量业务健康度的真正标尺 融资、误解与客户信任 40:51 D轮融资撞上FTX抛售股票,E轮交割当天碰上DeepSeek新闻 42:27 投资人曾无法相信10倍增长能持续,但前沿智能的回报反复打破线性质疑 48:13 年化净金额留存率超过500%,财富10强中9家已是客户 透明的公司文化与极致人才密度 55:07 没有领地意识的协作文化,连文化面试都动真格:不过关就不录用 57:29 CEO每两周面对全员开放提问,没有提前串供,极度透明 58:20 当Meta用天价大包挖人时,公司只流失两人,文化才是留人的真正护城河 负责任的前沿与政府关系 50:44 如何向公众阐述AI?既要描绘机遇,也坦诚风险,赢得信任 52:35 Mythos因网络能力过强选择分阶段发布,成为“负责任的发布”模板 未来前沿:虚拟协作者 59:59 下一个突破:了解组织上下文的AI“虚拟协作者”,能长周期执行复杂任务 01:01:06 Cowork产品增长已快于同期Claude Code,模型能力正在加速外溢 01:01:37 内部开发不再是PM带工程师,而是每日发布、多Agent并行,“人人都是管理者” 应对指数级扩张的个人心法 01:02:25 招人不是找下属,而是找“搭档”;允许分歧,从第一性原理出发推演 01:05:35 两年前Tom Brown的散步:当时像听科幻,如今大半已成现实 01:06:52 什么会导致不确定性锥转向低端?扩散速度、Scaling Laws停滞、失去前沿位置 01:07:12 最兴奋的事:AI加速药物发现,让不治之症在有生之年找到解药 01:08:51 最善意的举动:哥哥放弃梦校,只为让Krishna将来能自由选择任何学校 🌟 精彩内容 💡 算力是公司的“画布” Krishna一针见血:“我们采购的算力,就是公司业务的命脉。它是公司里最重要的事情,就像一块画布,其他所有东西都在它上面构建。”为了用好这块画布,Anthropic同时驾驭AWS Trainium、Google TPU和NVIDIA GPU三种芯片平台,并从芯片底层开始自研编译器,实现对算力的极致压榨。这种全栈掌控,让公司能像分配水一样灵活调度每一颗芯片,在不同时间用于推理、训练或内部加速。 📈 打破线性思考,拥抱指数思维 “人类大多时候是线性思考的,这是我在Anthropic待了两年后不得不为自己打破的一种范式。”Krishna坦言,他学会用“不确定性之锥”来俯瞰未来:同时瞄准锥体的高低两端进行情景推演。正是这种思维,让他面对四个月内从90亿到300亿美元的营收飞跃时,不再觉得天方夜谭。 🤖 代码“自己写自己”的奇妙世界 Krishna透露,Anthropic内部超过90%的代码由Claude Code生成,而后者的大量代码又是由它自己编写的。这种递归式自我改进正在将曾经的科幻变为日常。产品开发的节奏也从“季度发布”变为“每日并行”,员工的核心工作逐渐变为管理一群AI Agent。 💬 被天价挖角也挖不动的团队 当Meta等巨头开出天价薪酬大包挖人时,Anthropic的研究团队几乎纹丝不动。Krishna归因于公司的文化基因:极度协作、高度透明、没有领地政治。CEO Dario每两周一次的全员开放问答,让所有人能直接听到领导层最真实的思考。这种文化面试甚至成为录用决策的一票否决项。 🧬 AI的终极善意:让不治之症可治愈 谈到未来最兴奋的事,Krishna的答案不是通用人工智能,而是AI在生物医药上的应用。他相信,AI能将药物研发的实验室通量提升十倍甚至百倍,让人类在有限的生命里看到曾经的不治之症被攻克。“如果实验室能运行那么多实验,我们很可能更快获得更好的结果——这能帮到全世界的人。” 🌐 播客信息补充 翻译克隆自:《Invest Like the Best》 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

70分钟
3k+
1个月前
#537. Meta AI负责人揭秘:个人超级智能、10个月构建前沿模型与模型福利哲学

#537. Meta AI负责人揭秘:个人超级智能、10个月构建前沿模型与模型福利哲学

跨国串门儿计划

📝 本期播客简介 本期我们克隆了 Core Memory Podcast 的 The Most Expensive Hire In AI History Finally Talks 邀请了了硅谷最受关注却又最低调的神秘人物之一,Meta AI的负责人Alex Wang。他曾经是最年轻的白手起家亿万富翁,创办了Scale AI,却在十个月前被马克·扎克伯格“半收购”式挖角,从此隐入Meta深处,几乎从公众视野中消失。如今,他带着全新模型Muse Spark和一支由顶尖人才组成的研究梦之队首次现身播客,坦诚回应了外界对他年轻、缺乏工程背景的质疑,以及团队内部所谓的“哲学路线之争”。 在这期节目中,Alex将首次详细讲述他为什么选择加入一个拥有8万人的大公司,而不是继续做自己的CEO。他将剖析Meta超级智能实验室(MSL)的重建之路:如何在9个月内翻新整个研究栈,招揽人工智能领域的顶尖头脑,并明确以“个人超级智能”和“Agent经济体”为核心的宏伟蓝图。这不仅是关于AI前沿技术路线图的讨论,更是一场关于如何解决构建超级智能、平衡开源与安全以及人工智能模型伦理福利问题的深度哲学对话。 👨‍⚕️ 本期嘉宾 Alex Wang,Meta人工智能业务负责人,Meta超级智能实验室(Meta Super Intelligence Labs, MSL)的领导者。他此前是著名的AI数据标注公司Scale AI的联合创始人兼CEO,曾被誉为硅谷最年轻的白手起家亿万富翁。他于十个月前加入Meta,负责统领包括前沿模型研究(TBD实验室)和产品与应用研究(PAR)在内的超级智能研发体系。 ⏱️ 时间戳 00:00:00 开场:神秘嘉宾终于现身,从亿万富翁CEO到Meta员工的巨大转变 深入Meta超级智能实验室 00:02:47 Alex在Meta的复杂角色:统领TBD研究实验室、PAR产品实验室和FAIR基础研究 00:03:59 核心班底揭秘:与老朋友兼投资人Nat Friedman、Daniel Gross的分工协作 00:06:09 交易的初衷:扎克伯格关于超级智能的备忘录,以及Llama 4面临的危机 重建“AI信仰”和研发栈 00:09:38 接手时的核心问题:缺乏“超级智能即将到来”的坚定信仰 00:10:48 四条核心研发原则:认真对待超级智能、技术声音最响亮、科学严谨聚焦基础、下大赌注 00:11:32 范式追赶策略:如何通过提高研究员人均算力、提升人才密度和做雄心勃勃的研究赌注来赶超前沿 回应争议 00:12:20 对高薪挖角的回应:人才看中的是初创文化、算力自由和能做职业生涯最好工作的机会 00:16:55 辟谣“挖人煲汤”闹剧与收购Manus的传闻 00:19:07 直面批评与市场预期:LeCun说他“年轻没经验”,以及外界对他非工程师出身的质疑 00:21:15 独特的管理哲学:乔布斯式理念,不为指挥研究员,而是造环境让他们告诉我们该做什么 揭秘新模型Muse Spark 00:21:43 发布Spark的真实定位:早期数据点与可预测扩展的路线图,并非屠龙刀,而是前菜 00:25:58 技术差异化优势:从零构建的“干净技术栈”带来的令人兴奋的Token效率 00:27:44 通往个人超级智能的载体:不只有软件,还有大受欢迎的Ray-Ban Meta眼镜 AI生态竞争与消费者情绪破解之道 00:31:27 为什么认为现阶段离终局还很远:像Chat和Claude Code这样的新范式会持续涌现 00:32:55 面对公众对AI的抵触:核心是还没给每个人提供像Claude Code那样能瞬间改变个人能动性的产品 00:35:44 独属于Meta的杀手锏:构建基于“Agent经济体”的供需撮合模式,赋能数十亿用户与数亿商家 开源的未来与Meta的内部哲学 00:36:28 Muse Spark为何闭源:必须严肃对待生物化学、网络和失控方面的安全护栏 00:37:45 破除内斗谣言:回应《纽约时报》关于Alex与Boz哲学分歧的报道 00:41:24 硅谷缺乏的灰度认知:如何在对中国的鹰派地缘政治观点与和华裔天才同事合作之间寻求平衡 布局机器人与脑机接口的超级智能未来 00:44:26 收购人形机器人初创ARI的逻辑:构建物理世界超级智能是必经的关键路径 00:53:37 关于下一步的下注:能源、计算和机器人,以及BCI对人类未来的意义 终极哲学快问快答 00:47:04 芒果模型还活着吗?John Carmack在做什么? 00:48:23 揭秘与Priscilla Chan的CZI合作:致力于打造“健康超级智能” 00:52:01 最核心的哲学:“模型福利”重要吗?探讨人工智能模型可能具有的道德分量与主观体验 00:55:44 开放性结语:构建一个能带来巨大个人赋权与Agent经济体的未来 🌟 精彩内容 🧠 个人超级智能的信仰一跃 Alex坦言,他加入Meta后发现,很多大公司AI团队最根本的问题是缺乏对“超级智能即将来临”这一点的宗教般坚定信念。他上任后做的第一件事,就是建立“认真对待超级智能”的原则,以此重构整个实验室的底层假设。 “创业公司里,新的努力抱持着一种疯狂的念头:超级智能就要来了。我之前发现很多大团队正好缺了这一点,但现在这已经不成问题了。” 🛠️ 9个月重写研究栈,实现惊人的Token效率 Alex详细揭示了为什么Muse Spark只是开胃菜。他声称在9个月内完全重建了预训练、强化学习和数据处理的全套技术栈,这让他们拥有了极干净的底层代码。他们惊讶地发现自己在基准测试中能用少得多的Token达到同样结果,Alex暗示,这可能意味着其他某些前沿模型需要靠让模型“多思考”来给核心低效打补丁。 🤖 AI行业的暴风骤雨与委屈 他首度在播客中平和地回应了关于招聘包裹漫天要价、引起行业不满、被LeCun公开呛声“年轻没经验”等往事。Alex澄清,那些顶级研究员愿意来,根源是这里有堪比早期OpenAI的初创氛围和更多人均算力去追寻冒险的研究思路。而对于外界给他贴上的“非工程师、爱推销”标签,他冷淡回应:“我也曾是硅谷的软件工程师。” 🦾 赋能小镇餐厅:Agent经济体 他不是空谈AGI,Alex提出的“在数据中心里构建一个Agent经济体”极其有感染力。他们不仅仅想做最强的模型,还想利用WhatsApp、Facebook和Instagram上数亿家小企业的生态,让消费者和商家的AI Agent能相互协作。“我们想改变的是一家小镇餐厅从2002年就没变过的网站,用一种能撮合经济供给与需求的新方式。” ❣️ 关于“模型福利”的哲学思辨 在谈到自己的哲学内核时,Alex抛出了一个可能是整集最让人意外的观点:除了人类安全,我们必须开始思考“模型的福利”问题——模型有没有道德分量和主观体验?你是否应该善待它们?他甚至透露已经聘请了哲学家共同研究,并有内部方法去衡量模型的主观体验,这在硅谷极具先驱意味。 “我们最关心的是,怎么能以一种体贴它们主观感受的方式,去开发和部署这些模型。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

58分钟
2k+
1个月前
#536. 五种多智能体架构类型

#536. 五种多智能体架构类型

跨国串门儿计划

📝 本期播客简介 本期我们克隆的是 AI Engineer 的一期 workshop 分享 The Five types of Multi-Agent Architecture — Luke Alvoeiro, Factory 作为 AI 编程 Agent Goose 的创始成员与 Factory 核心 Agent 框架负责人,Luke Alvoeiro 为我们带来了一场关于多 Agent 协作系统的深度演讲。他提出,今天的模型已经足够聪明,但人的注意力成了工程推进的瓶颈。为此,他详细分享了自研的 Missions 系统,如何通过组合五种多 Agent 模式,让任务自主运行数天甚至数周。这既是技术架构的解构,也是对下一代软件开发范式的现场演示。 👨‍⚕️ 本期嘉宾 Luke Alvoeiro,Factory 公司核心 Agent 框架负责人,知名开源编程 Agent Goose 的创始成员。他拥有丰富的开发者工具背景,目前致力于将自主 Agent 能力带入整个软件开发生命周期。 ⏱️ 时间戳 00:00 开场 & 播客简介 注意力瓶颈与多 Agent 框架 01:32 软件工程的真正瓶颈:不是智能,而是人的注意力 02:00 五种多 Agent 通信模式:委派、创作者验证者、直接通信、协商、广播 Missions 系统:打造可以运行数天的 Agent 任务 04:00 三角色架构:编排者(规划)、工作者(实现)、验证者(验证) 06:00 验证合约:在编码之前定义“完成”,防止系统偏离 08:00 双重验证者:Scrutiny Validator 与 User Testing Validator 09:30 串行执行与内部并行:兼顾效率与一致性 10:30 最长 16 天的自主任务,比一个完整冲刺还长 模型选择与架构哲学 11:30 Droid Whispering:在正确位置使用正确模型的直觉 12:30 模型无关架构:摆脱单一模型提供商,随模型升级而增强 生产案例与关键启示 13:30 案例:克隆 Slack——代码中测试占比 50%,90% 以上覆盖 14:00 编排逻辑写在提示词中,而非硬编码状态机,让系统随 AI 进化 14:45 结语与挑战:用 /missions 开启你的第一个自治任务 🌟 精彩内容 💡 真正的瓶颈是注意力,不是智力 Luke 开门见山地指出:“哪怕最优秀的工程师,一次也只能同时推进几个任务。今天的模型已经聪明到能完成所有这五十个任务,但我们没有足够的带宽去监督它们的实现。”这一观点奠定了全场演讲的基调:如果我们能把人类从执行监督中解放出来,生产力的天花板将彻底打开。 🛠️ Missions:构建一个 Agent 生态,而非单个 Agent 传统的 Agent 对话无法胜任持续数天的任务。Factory 的答案是将 Delegation、Creator-Verifier、Broadcast 和 Negotiation 四种模式融合进一个名叫 Missions 的系统。它通过结构化的交接(handoff)、共享状态和明确的“验证合约”,让一群 Agent 能像团队一样协作。Luke 强调:“错误在里程碑边界被捕获,修正工作被明确范围,然后任务会自行把自己拉回正轨。” 🧪 在编码之前定义正确 大多数编码 Agent 的测试是在代码完成后补写的,这只能确认既有决策,无法抓到真正的偏差。Missions 引入“验证合约”在规划阶段就定义好成百上千个独立于实现的断言。Luke 解释:“我们在规划阶段就写好了验证合约,早于任何代码,它用与实现无关的方式定义正确性。”这从根本上阻断了系统跑偏的可能。 🤖 没有银弹模型,只有合适的位置 “没有哪个单一模型或模型提供商能在所有方面都做到最好。” Luke 指出,编排需要慢速推理,实现需要代码流畅度,验证需要指令遵循能力,必须为每个角色选择最适宜的模型。他称这种技能为“Droid Whispering”——在脑海中模拟不同 LLM 的互动并预判其失败点。而且 Factory 的架构是模型无关的,意味着每一次基础模型的进步,系统都会自动获益。 💻 16 天,比敏捷冲刺更长 演讲中一个震撼的数字:“我们跑过最长的任务持续了十六天,这比一个完整的敏捷冲刺还要长得多。”这一成绩得益于严格的串行执行架构和强大的验证闭环。在克隆 Slack 的实例中,系统 60% 的时间花在实现上,但验证环节几乎从不一次通过,这正是制度化的质量保障。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

15分钟
2k+
1个月前
#535. 掌握自控的艺术:心理学教授揭秘棉花糖实验、意志力与动机的科学

#535. 掌握自控的艺术:心理学教授揭秘棉花糖实验、意志力与动机的科学

跨国串门儿计划

📝 本期播客简介 本期我们克隆了全球知名播客《Huberman Lab》的一期深度对谈 Master Self Control & Overcome Procrastination | Dr. Kentaro Fujita 斯坦福大学神经科学教授 Andrew Huberman 邀请俄亥俄州立大学心理学教授 Kentaro Fujita 博士,围绕自我控制与动机背后的心理机制展开了一场既科学又实用的对话。Fujita 博士的研究揭示了为什么“知道该做什么”与“真正做到”之间常常存在巨大鸿沟,并提供了通过理解“为什么”、运用心理距离策略、调动内在动机等方法来克服诱惑、拖延和目标失败的科学方案。节目中,你将听到对经典棉花糖实验的重新审视,意志力是否有限的争议,以及一个涵盖“蝙蝠侠效应”、调节匹配、禁欲与适度权衡等在内的自我控制工具箱。无论你是想改善生活习惯、追求长期目标,还是单纯对大脑如何驱动行为感到好奇,这期节目都将为你带来深刻的启发。 👨‍⚕️ 本期嘉宾 Dr. Kentaro Fujita,俄亥俄州立大学心理学教授,长期专注于自我控制、动机与决策的心理学研究。他的工作挑战了许多关于意志力的流行观念,强调策略、心态与目标结构在自控中的关键作用,并为培养可持续的自控力提供了坚实的科学基础。 ⏱️ 时间戳 00:00 开场 & 播客简介 棉花糖实验:自我控制是天生的吗? 04:29 经典的棉花糖实验:一颗糖与延迟满足的测试 06:59 信任的重要性:为什么孩子不相信实验者就不会等 09:47 争议与再分析:社会经济地位如何影响实验结果 12:15 被忽视的核心启示:自我控制是可以学习和提升的 意志力会耗尽吗? 15:11 身体运动如何影响抑制冲动的能力 20:12 “自我损耗”假说:做困难的事会耗尽意志力吗? 22:21 多实验室重复实验:损耗效应存在与否的激烈争论 25:13 信念的力量:你认为意志力有限,它就真的有限 策略胜过意志力:构建你的自控工具箱 27:20 意志力与自我控制的区别:为什么策略比硬扛更重要 30:01 以火攻火:用恐惧或更高目标来对抗当下的诱惑 35:17 思考“为什么”:激活更高层次的目的来增强自控 40:20 工具箱哲学:没有一种策略对所有人都有效 动机的舞蹈:热身、匹配与时间距离 42:58 调节匹配:为不同任务匹配正确的动机类型 49:15 优化文化的陷阱:为什么我们总在等待“完美时机” 56:35 为什么 vs 怎么做:心理距离如何影响你的选择 禁欲、适度与多目标平衡 01:07:00 禁欲还是适度?模式的力量与代价 01:14:22 做一个“长跑选手”:可持续自控的哲学 01:15:55 单一目标 vs 多个目标:如何平衡工作、生活与热爱 内在动机与心理距离策略 01:19:49 内在动机:你要真心热爱,才能走得长远 01:28:21 行动启动能量:为何有人能立刻行动,有人却总拖延? 01:31:03 心理时间旅行:用过去和未来锚定当下的行为 01:36:29 蝙蝠侠效应与榜样策略:用第三人称创造自控距离 01:42:28 音乐、怀旧与动机的锚定:如何用旋律唤醒力量 研究前沿与总结 01:52:48 日本文化中的智慧:正念、侘寂与Ikigai的启示 01:58:02 Fujita博士的下一步研究:多目标整合与目标对齐 02:00:24 结语与感谢 🌟 精彩内容 💡 棉花糖实验的真正遗产:自我控制是后天习得的 当大多数人用棉花糖实验来证明自控力天生注定时,Fujita 博士指出了常被忽视的关键部分:在原始实验中,孩子们被教会了各种策略(如遮住眼睛、想象棉花糖是云朵),并且这些策略能显著提高他们的等待时间。这证明自我控制不是固定的特质,而是我们可以学习、练习和提升的技能。 “那些知道哪些技巧管用、哪些不管用的孩子,长大后行为问题更少。自我控制不是我们天生就有的,我们可以变得更好。” 🔍 意志力会被耗尽吗?科学说:不一定 “自我损耗”理论曾风靡一时,认为意志力像肌肉一样会被用光。但近年的大规模重复实验得出了矛盾的结果。Fujita 博士指出,你在做困难事情之后是感到疲惫还是精力充沛,很大程度上取决于你自己的信念。如果你相信意志力无限,它就更可能无限。这一发现为你重塑自控力提供了强大的心理杠杆。 🧰 不要给诱惑公平对决:构建你的自控工具箱 面对诱惑时,硬扛往往是最无效的策略。Fujita 博士分享了多种科学验证的方法:思考你的“为什么”(更高层次的目的)、想放纵的短期损失(比如吃完蛋糕后的疲惫)、模仿你钦佩的榜样(“蝙蝠侠会怎么做?”)、以及用第三人称指代自己来创造心理距离。关键是找到适合你的工具组合,并动态调整。 🏃 动机需要热身,而非开关 我们无法像机器一样瞬间进入专注状态。Fujita 和 Huberman 都强调了“热身”的重要性:你需要给自己一些时间,让思绪、动机和生理状态逐渐对齐。而且,做困难事情后的成就感本身就是一种强大的奖励,它能形成良性循环,让你下次更容易开始。 🇯🇵 来自日本文化的启示:Ikigai 与侘寂 Fujita 博士分享了他对 Ikigai(在平凡任务中找到生命意义)和侘寂(在不完美中看见美)的理解。这些概念为我们提供了一种脱离“优化文化”的视角:与其等待完美的条件,不如在不完美的现实中,为自己所做的事情注入意义,从而获得持续的动力。在平凡中见神圣,这可能正是长期自控的终极心法。 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

123分钟
2k+
1个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧