播客无国界 - 节目列表

EP138：预测 2026-Agent 专用芯片崛起、开源体验补课与多模态的模块化未来

当 2025 年即将结束时，AI 行业兑现了多少承诺？本期 IBM Mixture of Experts 节目汇聚了四位顶尖技术专家，从智能体（Agent）、开源生态、底层硬件到多模态技术四个维度，进行了一场深度的年度复盘与未来推演。如果说 2024 是大模型的爆发元年，那么 2025 年则是技术深水区的一年。专家们辩论了为什么备受期待的“智能体”似乎在消费者端“销声匿迹”，却又无处不在；探讨了开源模型虽在性能上追平闭源，却为何在用户体验上仍有巨大鸿沟；以及在算力结构性短缺的背景下，专门为 Agent 设计的处理器（Agent Processors）将如何改变 2026 年的硬件格局。无论你是技术决策者还是 AI 开发者，这期对 2026 年的硬核预测都将为你厘清未来的战略方向。时点内容 | Key Topics * 智能体（Agent）的“隐形”胜利：回顾 2025：针对“智能体并没有像预期的那样普及”的质疑，专家认为 Agent 并非消失了，而是像 Perplexity Deep Research 或 Claude Code 一样融入了工作流，变成了“隐形”的基础设施。入口之争：未来的战场不在于独立的 Agent App，而在于谁能成为“超级智能体”的入口——浏览器（如 Chrome, Comet）和手机操作系统将是各大巨头的必争之地。控制面板：预测 2026 年将出现“智能体控制面板”（Agent Control Plane），用于集中管理和调度分散在不同环境中的 AI 助手。 * 开源 AI 的“Linux 时刻”：性能 vs. 体验：虽然开源模型（如 Kimi 等）在基准测试上已追平甚至超越闭源模型，但开源界仍缺乏将模型封装为极致用户体验（如“一键生成宝可梦卡片”）的标准软件栈。 2026 预测：开源生态将补齐 UX 和编排层的短板。未来格局将类似操作系统市场：开源模型像 Linux 一样运行在底层服务器和基础设施中，而闭源模型则像 macOS/Windows 一样占据高端用户体验市场。 * 硬件瓶颈与 Agent 专用芯片：算力两极分化：2025 年确立了算力的结构性短缺，硬件市场分裂为追求极致性能的“Scale Up”（H200/B200 集群）和追求边缘效率的“Scale Out”（量化模型、端侧推理）。 Agent Processors（智能体处理器）：专家大胆预测，为了应对 Agent 长时间运行、需要记忆持久化和低延迟规划的特性，2026 年可能会诞生专门优化 Agent 工作负载的新型芯片架构。 * 多模态的务实进化：模块化多模态：企业级应用不再迷信“万能的大一统模型”（Omni Models），而是转向通过编排（Orchestration）串联多个轻量级、专用的 Adapter（如专门的 OCR 模块、图表分析模块）。从生成到理解：相比于“文生图”的创意功能，2026 年的企业重点将是“计算机使用”（Computer Use）和复杂文档/图表的数据提取，以服务于更精准的 RAG（检索增强生成）流程。相关链接与资源： [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

35分钟

EP137：Google DeepMind 机器人负责人专访-当 Gemini 拥有了身体

过去的机器人要么是只能在工厂做重复工作的机械臂，要么是在实验室里跌跌撞撞的“醉汉”。而在本期 Google DeepMind 播客中，主持人 Hannah Fry 深度对话了 DeepMind 机器人研究负责人 Carolina Parada，揭示了机器人领域正在发生的巨大飞跃。通过将 Gemini 的多模态能力引入物理世界，DeepMind 正在构建能听、能看、甚至能理解“灌篮”概念的通用机器人。Carolina 详细解释了他们如何利用**“双系统”架构（System 1 & System 2）**——模仿人类大脑的“快思考与慢思考”，完美解决了大模型推理慢与物理世界要求实时反应之间的矛盾。这不仅是关于机械的故事，更是关于 AI 如何真正获得“常识”并理解物理世界的里程碑。如果你好奇通用机器人何时能进入家庭，这期节目将给出最前沿的答案。时点内容 | Key Topics * Gemini Robotics 的核心理念：以前的机器人是被编程来执行特定任务的，现在的目标是构建通用的、能推理的机器人。 * 进化的三个阶段：从早期的强化学习（叠积木），到引入 LLM（能听懂“我渴了”），再到现在的多模态 Transformer（理解视觉、语言并转化为动作）。 * 双系统架构（快慢思考）： System 2 (Slow & Clever)：云端的大模型（Gemini）负责复杂的推理和规划，比如理解“收拾桌子”意味着什么。 System 1 (Fast & Reactive)：端侧的小模型负责毫秒级的实时反应，比如手被挡住时立即避开，无需等待云端指令。 * 超越模仿：机器人如何通过理解“灌篮”的抽象概念，成功玩弄它从未见过的篮球玩具，而不是单纯的动作复制。 * 灵巧性的突破：为什么系鞋带、折纸这些对人类很容易的事，对机器人来说却是巨大的挑战？（莫拉维克悖论的讨论）。 * 数据采集的秘密：研究人员如何通过 VR 头显和手套进行“傀儡操作”（Puppeteering），以第一人称视角教会机器人复杂的精细动作。 * 安全性与阿西莫夫定律：介绍了 DeepMind 构建的 Asimov 数据集，教机器人理解物理世界的安全边界（例如：为什么不能把毛绒玩具放在热炉子上）。 * Sim-to-Real Gap：模拟环境与真实世界的差距依然存在，特别是涉及柔性物体（如衣物）和流体时，真实世界的训练依然不可替代。 * 未来的预测：行业讨论的风向已变——从怀疑“有生之年能否看到通用机器人”，变成了争论“是 5 年还是 10 年”。相关链接与资源： [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

48分钟

92

EP136：Bash is All You Need-Claude Code 团队揭秘 Agent 开发的终极哲学

在 Agent 框架层出不穷的今天，Anthropic 官方推出的 Claude Agent SDK 有何不同？本期节目是 Anthropic 工程师 Thariq Shihipar 的全长 Workshop 实录，深度解析了构建高质量 Agent 的“Anthropic 之道”。不同于传统的“工具调用（Tool Calling）”模式，Thariq 提出了一个激进且核心的观点：“Bash is All You Need”。他解释了为什么给予 Agent 访问终端和文件系统的权限，比预定义数百个特定工具更具扩展性和鲁棒性。这不仅是 Claude Code 背后的技术栈，也是未来 Agent 开发的新范式。本期内容涵盖了从理论到实战的全过程： * 核心理念：为什么 Agent 应该像人类一样使用计算机（Bash、文件系统、编辑器）？ * 架构设计：如何设计高效的 Agent Loop（收集上下文 -> 采取行动 -> 验证工作）？ * 实战演示：通过现场编写一个 Pokemon 数据分析 Agent，展示如何利用 Code Generation（代码生成）解决非编程任务。 * 进阶技巧：如何利用子智能体（Sub-agents）分担任务，以及如何通过文件系统进行“上下文工程”。无论你是正在构建 AI 应用的开发者，还是对 Claude Code 幕后技术感兴趣的极客，这堂 Workshop 都将颠覆你对 Agent 开发的认知。时点内容 | Key Topics * Claude Agent SDK 的诞生：它是建立在 Claude Code 之上的框架，旨在复用 Anthropic 内部构建 Agent 的最佳实践（如错误处理、工具压缩等）。 * 核心哲学 "Bash is All You Need"：相比于定义无数个僵化的工具（如搜索工具、Lint 工具），Bash 提供了极致的组合性和通用性，是 Agent 的“万能工具”。 * Agent Loop 的三大支柱：收集上下文 (Gather Context)： Agent 像人类一样通过 grep、ls 等命令主动寻找所需信息，而非被动接收。采取行动 (Take Action)：使用 Bash 或 Code Gen 执行任务。验证工作 (Verify Work)：这是最关键的一步。Agent 需要能运行代码、检查报错或自我审查，以确保结果准确。 * 工具选择指南： Tools：适合原子化、高可靠性、不可逆的操作（如发送邮件、写入文件）。 Bash：适合组合性任务、探索性操作和低上下文消耗的场景。 Code Generation：适合动态逻辑、复杂数据分析和需要 API 组合的场景。 * 上下文工程 (Context Engineering)：利用文件系统作为 Agent 的记忆和上下文管理工具。 * 技能 (Skills) 与子智能体 (Sub-agents)：如何通过定义 Skills 来“渐进式披露”复杂任务的指南？如何利用 Sub-agents 并行处理任务并保护主上下文不被污染？ * 安全性 (The Swiss Cheese Defense)：通过模型对齐、工具解析器（Parser）和网络/文件系统沙盒（Sandboxing）构建多层防御体系。 * 现场实战 (Live Prototyping)：演示如何从零开始构建一个 Pokemon Agent，利用代码生成来查询 API 并分析数据，展示了从简单 Prompt 到复杂 Agent 的演进过程。相关链接与资源： [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

96分钟

EP135：ElevenLabs CEO 专访-语音为何是 AI 的下一个交互界面？

在 AI 语音生成领域，ElevenLabs 无疑是当今最耀眼的独角兽。本期节目，a16z 合伙人 Jennifer Li 深度对话 ElevenLabs 联合创始人兼 CEO Mati Staniszewski。 Mati 分享了 ElevenLabs 从波兰单调的电影配音痛点出发，一路成长为拥有 10000 种声音、支付给社区 1000 万美元报酬的语音生态平台的故事。您将了解到： * 技术与产品的平衡： ElevenLabs 如何在保持 20 个小团队（每个 5-10 人）独立运作的同时，实现惊人的发布速度和质量控制？ * 全球化人才策略：为什么 Mati 认为欧洲团队比美国团队更有激情？他们如何发掘那些“白天在呼叫中心接电话，晚上写开源代码”的非典型人才？ * 商业模式的进化：从服务个人创作者到深入医疗、电信等企业级市场，ElevenLabs 如何解决合规、版权（如与四大唱片公司的 18 个月谈判）和信任问题？ * 组织管理的艺术：为什么取消所有职级头衔（Title）反而促进了扁平化管理？在公司扩张到 350 人时，如何调整销售激励以避免“为了佣金卖给竞争对手”的乌龙？无论你是 AI 创业者、产品经理，还是关注生成式 AI 商业落地的投资者，这期对话都将为你揭示一家顶尖 AI 应用公司的内部运作机制和未来愿景。时点内容 | Key Topics * ElevenLabs 的起源：两位波兰联合创始人如何因无法忍受本国单调的电影配音（所有角色都由同一人毫无感情地朗读）而萌生创业想法，并最终将其转化为全球领先的 AI 语音模型。 * 速度与质量的护城河：拥有 20 个独立的产品团队，每个团队仅 5-10 人。如何通过设定“六个月产品与市场契合（PMF）期限”来保持初创公司的敏捷性？ * 研究与产品的博弈：面对用户对“语速滑块”的需求，技术团队坚持通过模型研究解决，而产品团队最终通过简单的工程手段快速满足用户——如何在理想主义与实用主义之间做取舍？ * 非传统招聘：招聘了一位在呼叫中心工作却拥有顶级开源 TTS 项目的开发者；分享了为什么欧洲人才在某些方面比硅谷人才更具饥饿感和忠诚度。 * 版权与创作者经济：建立了 Voice Marketplace，让声音所有者获得收益（已支付 1000 万美元）。 * 与音乐行业的艰难谈判：历时 18 个月与环球、索尼等四大唱片公司达成协议，通过设定“强制时间点”（Forcing Function）来推动合作进程。 * 企业级转型：从 PLG（产品驱动增长）向企业销售转型。分享了医疗公司 Hippocratic 如何利用 ElevenLabs 构建能够自动打电话提醒病人吃药的 AI Agent。 * 扁平化管理实验：取消了公司内部的所有头衔（Titles），让“Go-to-market”团队只是团队，而不是 VP 或 Director，以此鼓励跨职能的流动和贡献。 * 销售激励的陷阱：随着团队扩张，如何发现并修正销售佣金制度中的漏洞（例如，为了佣金想把模型授权给基础模型竞争对手），并建立明确的政策护栏。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=ZqCEHR4wjxg 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

30分钟

67

EP134：Notion 如何重新定义未来的工作方式

Notion 如今已是估值超 100 亿美元、年收入（ARR）超 5 亿美元的超级独角兽，但在 2015 年，它曾濒临倒闭。当时的 Notion 现金流耗尽，产品建立在随时可能崩溃的单一数据库上，团队面临解散的危机。本期节目带我们走进 Notion 的幕后，对话联合创始人 Simon Last 和 COO Akshay Kothari。他们揭秘了那段最黑暗的时光——创始人如何破釜沉舟搬到日本京都，在完全不懂语言的环境下通过 18 小时的每日编程重建了产品。更重要的是，本期节目深入探讨了 Notion 3.0 的核心战略：全面拥抱 AI 代理（Agents）。Notion 内部目前拥有 560 个活跃的自定义 Agent，这意味着每两个员工就配备了一个 AI 助手。他们如何看待未来的工作形态？为什么说未来的每个人都将成为“AI 代理的管理者”？这是一次关于创业韧性、产品哲学与未来工作方式的深度探秘。时点内容 | Key Topics * 濒死体验与京都重生：回顾 2015 年 Notion 耗尽资金的危机时刻。创始人 Ivan 和 Simon 选择搬到京都，在与世隔绝的环境中重写代码，将“品味”（Taste）作为产品的核心护城河。 * 从 100 万到 5 亿 ARR 的扩张： COO Akshay 分享从 8 人团队增长到 1000 人大厂的挑战，以及在 TikTok 爆火导致服务器险些崩溃的惊险瞬间。 * COO 的自我毁灭哲学： Akshay 认为 COO 的工作就是不断“把自己炒鱿鱼”——先身兼数职（销售、财务、法务），然后招人替代自己，最终专注于最核心的战略。 * AI 时代的 Notion 3.0： Notion 不再仅仅是文档或数据库，而是致力于成为“知识工作者的 AI 基础设施”。 * 内部数据大公开： Notion 内部目前有 560 个活跃的自定义 AI Agent，相当于每两名员工就有一个 Agent 在后台处理重复性工作。 * 未来工作形态预测：人类的角色将从“执行者”转变为“协调者”。未来的工作不是自己动手做所有事，而是管理和审计一群日益复杂的 AI 智能体群（Swarms of Agents）。 * “柔软”的软件哲学：即使在 AI 时代，Notion 依然坚持软件应该是“可塑的”（Malleable）和“柔软的”，让用户像搭积木一样自定义自己的工具，而不是被僵化的 SaaS 流程所束缚。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=l8xdRcN81x8 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。附录： Notion 的创始人 Ivan Zhao 的精彩文章：《钢铁、蒸汽机与无限大脑》越来越清晰的感觉到，我们正处于 AI 革命的早期阶段，对于未来谁也不知道会怎么样，所以都喜欢从历史中、去工业革命、互联网革命中寻找规律，以期望能对未来有所启发。相对来说，这篇文章虽然也是尝试从钢铁和蒸汽机的历史里，寻找 AI 时代的答案，还是挺有深度。【1】第一个观点是：我们正在看着后视镜开车每一代新技术刚出来时，人们总是习惯用旧的方式去理解它。这就是所谓的“看着后视镜驶向未来”。想想看，早期的电话，大家把它当成“会说话的电报"；早期的电影，其实就是把摄像机架在观众席拍舞台剧。现在的 AI 也是一样。我们看到的 AI 大多长什么样？一个聊天框。为什么？因为它在模仿 Google 搜索框。我们正处在这个尴尬的过渡期。就像当年大家还不懂电影剪辑语言一样，我们现在还在试图把 AI 硬塞进旧的工作模式里。【2】个人层面：从骑自行车到开汽车乔布斯当年有个著名的比喻，说电脑是“大脑的自行车"。意思是它能让人跑得更快，但你还得自己蹬。对于现在的程序员来说，AI 已经不是自行车了，而是汽车。你不用蹬了，你只需要握好方向盘。 Ivan 讲了他的联合创始人 Simon 的故事。 Simon 以前是传说中的“10 倍工程师"，但现在几乎不自己写代码了。路过他工位，你会看到他像指挥官一样同时调度三四个 AI 编程智能体。这些 AI 不只打字快，还能思考。他在吃饭或睡前把任务排好队，AI 就在后台疯狂干活。他从“写代码的人"，变成了“管理无限大脑的人"。【3】为什么只有程序员先享受到了从骑自行车到开汽车的待遇？但问题来了，为什么只有程序员先享受到了这种待遇？普通的文案、运营、产品经理为什么还在“蹬自行车"？两个原因：第一，上下文太碎了。程序员的代码都在仓库里，环境单纯。但普通人的工作散落在 Slack、飞书、文档、甚至脑子里。AI 不知道前因后果，没法干活。第二，没法验证。代码写错了会报错，好坏一目了然。但一个活动策划案好不好？一份周报写得对不对？这很难量化。所以，想要从自行车升级到汽车，我们得先帮 AI 把上下文补齐，并且找到验证工作成果的方法。【4】组织层面：不仅是换引擎，还要换地基个人层面说完，Ivan 把视角拉到组织层面，用了“钢铁"和“蒸汽机"两个比喻，来解释 AI 会如何重塑公司。第一个是钢铁。在钢铁普及之前，房子盖不高。因为用砖头和木头，盖到六七层，底下的墙就被压垮了。这就像现在的公司，人数一过几百，沟通成本就爆炸了，效率急剧下降。人与人之间的沟通，就是那个脆弱的“砖墙"。 AI 就是组织的“钢铁"。它能支撑起巨大的信息流，让决策不需要层层汇报就能完成。未来的公司，可能几千人规模还能像创业团队一样敏捷，因为 AI 撑住了沟通的架构。第二个是蒸汽机。最早的工厂都建在河边，因为要用水车做动力。蒸汽机刚发明时，很多老板只是把水车拆了，换成蒸汽机，但工厂还在河边，流程也没变。效率提升非常有限。直到后来，老板们意识到： “等一下，既然不用水了，我为什么不把工厂搬到离港口更近的地方？" 工厂可以建在离工人、港口、原材料更近的地方。整个车间可以围绕蒸汽机重新设计。后来电力普及，工厂进一步把集中的动力轴拆散，给每台机器配上独立的电机。生产力才真正爆发，第二次工业革命才真正起飞。我们现在还在“换水车"阶段。AI 聊天机器人挂在现有工具上，工作流程还是为人设计的。我们还没认真想过：如果旧的约束消失了，组织应该长什么样？真正的变革，是当管理者意识到可以彻底重组工作流，让那些“不睡觉的大脑"去处理所有重复性工作的时候。 Notion 自己就在做实验。他们 1000 人的公司里，活跃着 700 多个 AI Agent。这些 AI 负责写会议纪要、回答内部咨询、处理 IT 请求、写周报。这不仅仅是省时间，这是在重塑组织形态。回看你的工作，如果只是用 ChatGPT 润色邮件，那你就是在把水车换成蒸汽机，工厂还在河边。试着想一想：如果我有无限个免费实习生（AI），工作流程应该怎么彻底重设计？【5】经济层面：从佛罗伦萨到东京最后 Ivan 把视角再拉高一层：钢铁和蒸汽不只改变了建筑和工厂，还改变了城市。几百年前，城市是人类尺度的。佛罗伦萨走个四十分钟就能穿城而过，生活节奏由人能走多远、声音能传多响决定。然后钢铁框架让摩天楼成为可能，蒸汽铁路把市中心和腹地连起来，电梯、地铁、高速公路跟上。城市在规模和密度上爆发了。东京、重庆、达拉斯，这些不是“更大版本的佛罗伦萨"，而是完全不同的生存方式——更混乱、更匿名、更难辨认方向，但也提供了更多机会和自由。 Ivan 认为知识经济正站在同样的转折点上。今天的知识工作占了美国 GDP 的近一半，但大部分还是人类尺度的运作：几十人的团队，会议和邮件定义的节奏，超过几百人就开始失灵的组织。我们用石头和木头建造了很多佛罗伦萨。当 AI 智能体大规模上线，我们会开始建造东京。成千上万的智能体和人类协作，工作流程全天候运转不等人醒来，决策在恰到好处的人类参与下被综合。周会、季度规划、年度考核的节奏可能不再合理，新的节奏会涌现。我们将失去一些“小而美"的清晰感，但会换来前所未有的规模和速度。 Ivan 提到一个历史趣事：1865 年英国有个《红旗法案》，规定汽车上路时必须有人举着红旗走在前面开路。听起来荒谬，但我们现在要求 AI 每做一步都要人确认，是不是也像“举红旗"？真正的未来，是人站在更高处监管，而不是挡在路中间。也许我们应该停止从后视镜看世界，开始想象新的可能。卡内基看着钢铁，看到了城市天际线。兰开夏郡的工厂主看着蒸汽机，看到了不再依赖河流的车间。我们还在问 AI 怎么当好“副驾驶"。也许该问的是：当无限心智成为基础设施，知识工作会变成什么样？这个问题，Ivan 没给答案。但他给了一个思考的框架。对于正在这场变革中的人来说，框架可能比答案更有用。

26分钟

EP133：（lenny播客）OpenAI Codex 产品负责人专访-Sora App 如何在 18 天内打造完成？

本期节目，Lenny 独家对话 OpenAI Codex 的产品负责人 Alexander Embiricos。在 GPT-5 发布后的几个月里，OpenAI 的编码智能体 Codex 经历了爆发式增长。Alexander 分享了 Codex 如何从一个模型代号重生为 OpenAI 最核心的“软件工程师队友”。这不仅是一次产品访谈，更是对 2026 年 AI 发展趋势的深度预演。你将听到 OpenAI 内部令人咋舌的开发速度——仅用 2-3 名工程师和 18 天就构建了霸榜 App Store 的 Sora Android 应用。Alexander 还深入探讨了为什么 AI 发展的当前瓶颈不再是算力，而是人类的“打字速度”和“审查速度”；以及 OpenAI 正在构建的神秘浏览器项目 Atlas。无论你是开发者、产品经理，还是关注 AGI 进程的观察者，这期内容都将带你提前看到 AI 协作的未来形态。时点内容 | Key Topics * Codex 的重生：为什么 OpenAI 决定重启“Codex”品牌？它不再仅仅是 Copilot 背后的模型，而是一个包含 VS Code 插件和 CLI 工具的完整编码智能体。 * Sora App 的疯狂开发：揭秘 Sora Android 应用的开发内幕——利用 Codex 进行代码移植和生成，仅用 18 天完成内部版，28 天正式上线并登顶 App Store。 * Atlas 浏览器： OpenAI 正在构建名为 Atlas 的浏览器？Alexander 解释了为何要进入浏览器领域，以及“上下文感知”如何让 AI 在网页工作中更主动地提供帮助。 * AI 的新瓶颈：一个反直觉的观点：目前限制 AGI 发展的最大因素是人类的打字速度和多任务处理能力（主要是为了审查 AI 的工作）。 * 从助手到队友：未来的 Codex 不仅仅是写代码，还能像真正的实习生一样，自我修复训练运行中的错误（On-call），甚至主动在 Slack 上回答数据波动的问题。 * 压缩人才栈（Compressing the Talent Stack）：设计师通过“Vibe Coding”直接生成动画代码，产品经理直接修改文案字符串——AI 如何模糊了传统职能的边界？ * AGI 时间表与 2026 预测： Alexander 预测 2026 年将是 Agent 真正爆发的一年，并给出了他对 AI 发展“曲棍球棒”曲线的看法。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=z1ISq9Ty4Cg 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

91分钟

EP132：从 15 人运营 4 个 SaaS 说起-揭秘 100% AI 原生公司的构建法则

在 AI 辅助编程普及的今天，许多公司虽然有 90% 的工程师在使用 Copilot，但依然保留着传统的开发流程。本期节目，我们邀请到媒体兼软件公司 Every 的 CEO Dan Shipper，他分享了一个激进的观点：90% 的 AI 采用率和 100% 的 AI 采用率之间存在着 10 倍的效率差距。 Dan 详细展示了 Every 作为一个仅有 15 人的团队，如何在不融资的情况下，仅靠单人开发者就构建并维护了 Kora、Monologue 等 4 个复杂的商业化软件产品。这背后的秘密在于他们彻底重构了工程流程，提出了**“复利工程”（Compounding Engineering）**的新范式——让 AI 编写 99% 的代码，并将每一次开发经验都固化为全公司共享的资产。你将看到 AI 如何让新员工入职第一天就提交代码，如何让不同技术栈的团队无缝协作，甚至让 CEO 利用碎片时间重回代码一线。时点内容 | Key Topics * 100% AI 采用率的质变：为什么说只要有 10% 的流程停留在旧时代，就会拖累整个组织的效能？从“辅助编码”到“全权委托”的思维转变。 * Every 的疯狂实验： 15 人团队运营 6 个业务单元和 4 个软件产品，且每个 App 仅由一名开发者构建，99% 代码由 AI 生成。 * 复利工程（Compounding Engineering）：只有 AI 时代才可能实现的工程新哲学。目标：让开发的每一个功能都使下一个功能的开发变得更容易。四步循环：计划（Plan）、委托（Delegate）、评估（Assess）、固化（Codify）。核心动作 Codify：将隐性知识（Tacit Knowledge）转化为全公司共享的 Prompts 和 Agent 配置文件。 * 组织架构的二阶效应（Second-order Effects）：隐性代码共享：不需要复杂的库封装，AI 可以直接读取同事的代码并为你在新栈中复现逻辑。新员工即插即用：所有的环境配置和规范都已写入 Agent，新员工第一天即可高效产出。跨项目贡献（Internal Open Source）：任何开发者甚至管理者都能轻松修复其他产品的 Bug，因为理解代码的成本几乎为零。技术栈自由：不再需要强制统一语言，AI 让 Python 和 Node.js 开发者之间的隔阂消失。管理者的回归：利用 AI 这种“注意力碎片化”工具，CEO 也能在会议间隙修复 Bug 或提交功能，重获对产品的掌控感。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=MGzymaYBiss 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

17分钟

55

EP131：AI 购物革命-从“搜索栏已死”到 3850 亿美元的新金矿

搜索栏正在消亡，消费者的购物习惯正经历一场从“搜索与浏览”到“提问与购买”的根本性重塑。当 ChatGPT 为 Zara 和 H&M 带来的流量占比甚至超过传统广告时，我们正站在一个价值 3850 亿美元的“代理商务（Agentic Commerce）”市场的入口。本期节目揭示了这场 AI 购物革命背后的底层逻辑：流量套利（Arbitrage）已从“注意力”转向了“信任”。AI 正逐渐成为消费者与产品之间最受信任的中间人。我们不仅会分析为什么大企业虽然看到了趋势却难以转身，更会为你提供三个具体可执行的商业模式，助你在 2026 年利用 AI 工具以极低的成本和极快的速度建立竞争优势，无论是打造 AI 原生品牌、构建垂直领域的购物代理，还是成为新兴的 GEO（生成式引擎优化）专家。时点内容 | Key Topics * 搜索栏的消亡与信任套利的崛起：消费者不再搜索关键词，而是向 AI 寻求直接的解决方案。AI 的推荐比付费广告更具公信力，标志着商业竞争的核心从争夺注意力转向争夺 AI 的信任。 * 商业模式一：AI 原生电商品牌（AI First E-commerce Brand）：极速验证：利用 Nano Banana 2 等图像模型在一个下午生成并测试数百个产品概念，无需预先制造。内容工厂：全自动生成产品图、视频广告和社交媒体内容，无需摄影师和工作室。低成本运营：利用现成的 AI 客服代理实现 24/7 服务，以极低的日常开销对抗传统巨头。 * 商业模式二：垂直领域的 AI 购物助手（Niche AI Shopping Assistant）：避开通用大模型：不要试图做一个“万能导购”，通用 AI 什么都懂但什么都不精。深耕价值型需求：针对道德供应链、纯素食主义者等特定群体，构建基于规则和深层数据的专用代理（如使用 n8n 等低代码工具），提供通用模型无法给予的深度验证和信任。变现路径：通过订阅费或高额佣金实现盈利，是一次构建、无限服务的“产品化服务”。 * 商业模式三：生成式引擎优化服务（GEO - Generative Engine Optimization）：新时代的 SEO：帮助品牌优化其在线资产，使其更容易被 AI 模型理解和推荐。蓝海市场：目前全球精通此道的专家极少。工作内容包括重写产品描述、添加结构化数据，确保品牌在 ChatGPT 等平台的回答中占据“首推”位置。持续性收入：这不是一次性的修复，而是需要长期维护的月费制服务。 * 数字地产的重要性：在 AI 时代，拥有一个清晰、可信的域名（如 .store）是向 AI 和用户传递“我是专业卖家”这一信号的关键，其带来的信任感直接转化为转化率。 * 未来的机会所在：真正的机会不在于开发大模型，而在于成为“系统架构师”——将强大的 AI 工具应用于现实世界的细分问题，从执行者转变为品味把控者和系统设计者。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=Lw5Gy881PJ8 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

15分钟

78

EP130：AI 工程化实战指南-RAG、微调与被低估的数据工作

在 AI 领域，Chip Huyen 是少有的既具备顶尖学术背景（斯坦福讲师、Netflix/NVIDIA 研究员），又能深入企业一线解决实际问题的实战派专家。她撰写的《AI Engineering》不仅是畅销书，更是无数开发者的案头指南。本期节目，Lenny 与 Chip 进行了一场硬核而深度的对话，直击 AI 应用开发的痛点。Chip 犀利地指出，大多数公司在 AI 转型中陷入了误区：过度迷恋最新的模型和新闻，却忽视了数据质量和用户需求这些“枯燥”但决定成败的基础工作。您将了解到： * 戳破泡沫：为什么 Chip 认为“紧跟 AI 新闻”往往是浪费时间？她那张刷屏的“认知偏差图”背后，揭示了构建 AI 产品时哪些工作才是真正的高杠杆。 * 技术祛魅：用最通俗的语言拆解预训练（Pre-training）、后训练（Post-training）、微调（Fine-tuning）和 RLHF 的本质区别。 * RAG 实战心法：为什么在检索增强生成（RAG）中，数据准备（Data Prep）远比选择哪个向量数据库重要？ * 工程师的未来： AI 会取代初级工程师还是让资深工程师更强大？Chip 分享了关于“系统思维”（System Thinking）为何是未来核心竞争力的独到见解。 * 跨界思考：从撰写技术书籍到创作虚构小说，Chip 如何通过跨界写作来提升对用户心理的感知力？无论你是正在构建 AI 应用的工程师、产品经理，还是关注技术趋势的决策者，这期节目都能帮你拨开迷雾，找到 AI 工程化的正确路径。时点内容 | Key Topics * AI 开发的认知偏差：深入解读那张病毒式传播的图表——人们以为重要的是最新的 Agent 框架和模型对比，但实际上真正重要的是与用户交谈、构建可靠的平台和准备更好的数据。 * 预训练 vs. 后训练：形象地解释预训练就像学习语言统计规律，而后训练（微调/RLHF）则是通过强化学习让模型掌握特定任务或领域知识。 * RAG（检索增强生成）的关键：许多团队过度纠结于数据库选型，却忽略了数据分块（Chunking）、元数据管理和文档重写等“数据准备”工作，而这才是提升检索质量的根本。 * 评估（Evals）的艺术：为什么在大规模应用中必须要有严格的评估体系，但在产品早期“凭感觉”（Vibes）可能就足够了？如何设计有效的评估指标？ * AI 对生产力的真实影响：分享了一个有趣的实验——将工程师分为高中低绩效三组，发现 AI 工具对高绩效工程师的提升最大，因为他们更具备解决问题的能力。 * 未来的核心技能：系统思维：随着 AI 接管越来越多的代码编写工作，计算机科学教育将从“教你写代码”转向“教你设计系统”和解决问题。 * 组织架构的变革： AI 正在打破产品、工程和设计之间的界限，未来的团队将更加融合，甚至出现“全栈构建者”。 * 个人哲学与写作： Chip 分享了她的人生格言“Nothing really matters”（虚无主义带来的自由感），以及通过写小说来训练“预测读者反应”的能力，这对做产品同样适用。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=qbvY0dQgSJ4 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

62分钟

EP129：（lenny播客）Block 如何转型为全球最 AI Native的企业

在大多数企业还在争论 AI 是否过度炒作时，Block（原 Square）已经通过内部自研的 AI Agent "Goose" 实现了惊人的效率提升。本期节目，我们邀请到了 Block 的首席技术官 Dhanji R. Prasanna，深度解析这家金融科技巨头如何转型为 AI 原生企业。 Dhanji 分享了 Block 如何通过组织架构重组（从 GM 结构转为职能结构）来打破部门壁垒，为 AI 的全面落地铺平道路。最令人兴奋的是，他详细介绍了基于开源协议 MCP 构建的 Goose——这不仅仅是一个聊天机器人，更是一个能操作数据库、编写代码、甚至自动优化日程的智能体。目前，Block 的 AI 前沿团队每周能节省 8-10 小时的工作时间。此外，Dhanji 还分享了他从 Google Wave、Google+ 到 Cash App 的职业生涯中汲取的宝贵教训，探讨了为什么“代码质量”往往与产品成功无关，以及为何初级员工和非技术人员反而是 AI 浪潮的最大受益者。无论你是正在探索企业 AI 落地的管理者，还是对 Agentic AI 感兴趣的开发者，这期节目都将为你提供一份来自一线的实战蓝图。时点内容 | Key Topics * Block 的 AI 宣言与转型： Dhanji 如何通过一封致 Jack Dorsey 的信推动公司转型，以及为何将公司重组为职能型架构（Functional Org）是实现技术聚焦的关键。 * Goose：企业级 AI Agent 实战：深入介绍 Block 内部开源的 AI 智能体 Goose。它如何基于 MCP（Model Context Protocol）连接 Snowflake、Tableau 等工具，自动生成营销报告、编写代码甚至管理日历。 * 真实的 AI 效率数据：尽管外界对 AI 生产力存疑，Block 的数据显示 AI 前沿团队每周节省 8-10 小时，全公司平均节省 20-25% 的手动工作时间。 * 非技术人员的 AI 赋能：令人惊讶的发现——非技术团队（如风险管理、法务）利用 AI 构建工具的积极性和收益往往超过工程师，实现了从“等待排期”到“自主开发”的跨越。 * 代码质量的迷思：结合 YouTube 和 Google Video 的案例，Dhanji 提出了一个反直觉观点：代码质量与产品成功几乎无关，过度追求架构完美反而可能阻碍价值交付。 * Vibe Coding 与未来编程：探讨从“乒乓式”对话编程到“自主式”异步编程的转变。未来，工程师可能在睡前布置任务，醒来后审核 AI 连夜完成的多个实验版本。 * 从小事做起（Start Small）：无论是 Cash App、比特币产品还是 Goose，Block 的许多核心产品都源于黑客松或个人的小实验。 * 失败的教训：回顾 Google Wave 和 Secret 等产品的失败经历，强调在产品开发中“接触地气”和验证核心假设的重要性。 * 给管理者的建议：亲自使用 AI 工具（Get your hands dirty），不要只看报告；在某些情况下，最好的优化是质疑流程本身的存在必要性，而非用 AI 自动化它。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=JMeXWVw0r3E 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

77分钟

EP128：被低估的 AI 消费级应用-为什么微短剧可能是下一个 Netflix

时尚独角兽 Polyvore 的 CEO，再到如今红杉资本（Sequoia Capital）的合伙人兼首席产品官，Jess Lee 的职业生涯是一部教科书式的“打怪升级”史。本期 Delphi 播客中，她不仅分享了自己在 Google 只有“工程师思维”时的惨痛教训，还坦诚剖析了作为 CEO 时在商业模式选择上的重大失误。这期内容对于创业者和产品人来说极具含金量。Jess 揭示了红杉看重创始人的核心特质——速度（Velocity）与讲故事的能力，并提出了一个评估人才的新框架（不仅看 IQ/EQ，还要看 PQ 和 JQ）。更令人耳目一新的是她对 AI 消费级应用的“非共识”判断：当所有人都在唱衰媒体投资时，她为何坚信 AI 生成的“微短剧”将诞生下一个 YouTube 或 Netflix？这是一场关于领导力、商业直觉与未来媒体形态的深度对话。时点内容 | Key Topics * 人才评估新框架：除了智商（IQ）和情商（EQ），高阶人才还需要政治商数（PQ，处理组织关系的能力）和判断力商数（JQ，商业决策的准确性）。 * Google 的成与败： Google 的伟大在于极致的工程文化和宏大的野心（如街景项目），但早期的失败案例（如分类广告项目）教训惨痛——因为缺乏早期的客户探索，导致做出了“除了结构化搜索没人想要”的产品。 * 从打杂到 CEO： Jess 分享了她在 Polyvore 如何通过“志愿主义”（主动承担没人做的杂事）从一名普通 PM 晋升为 CEO，以及如何克服伴随而来的冒名顶替综合症。 * CEO 的百万美元教训：回顾 Polyvore 的最大遗憾——选错了商业模式。她深刻反思了为何当初为了追求交易额（GMV）而放弃了类似 Figma 的设计工具路径，导致陷入了低复购的电商困境，而非高利润的 SaaS 模式。 * 社区建设的艺术：如何通过高接触服务（High-touch）建立邪教般的粉丝忠诚度？比如给用户送上他们收藏已久却买不起的那件单品。 * 红杉的投资视角：速度至上：创业就像翻牌游戏，唯一能控制的就是翻牌的速度（迭代速度）。故事即生产力：创始人必须像“邪教领袖”一样，用非理性的梦想吸引人才和资本。 * AI 消费应用的未来：反驳“媒体已死”的观点，看好 AI 驱动的娱乐内容。她预测 AI 生成的微短剧（如“哈利波特版宿醉”）将演变成巨大的新媒体平台，创造出新一代的创作者阶层。 * 团队组建哲学：寻找“有尖刺”（Spiky）的人才。不需要全能型选手，而是将一个极具创意但混乱的 PM 与一个极度有条理的设计师配对，通过互补实现卓越。相关链接与资源： [视频来源]https://www.youtube.com/watch?v=AmHNJbFlltk 本播客采用虚拟主持人进行播客翻译的音频制作，因此有可能会有一些地方听起来比较奇怪。如想了解更多信息，请关注微信公众号“心流赫兹”获取AI最新资讯。

39分钟