作为 Instagram 的联合创始人,Mike Krieger 曾定义了社交媒体的一个时代;现在作为 Anthropic 的首席产品官(CPO),他正在定义 AI 的交互形态。本期《AI Daily Brief》年终特别节目深度对话 Mike Krieger,揭秘了 Anthropic 内部如何看待代码生成、Agent(智能体)以及未来的企业应用。 你将听到 Claude Code(原 Claude CLI)是如何从一个内部黑客松项目演变成核心产品的,以及“Vibe Coding”(氛围编码)如何让非技术人员(比如 Mike 的妻子)也能构建复杂的应用。更重要的是,Mike 对 2026 年做出了务实的预测:如果说 2025 年是“编码智能体”之年,那么 2026 年将是企业的“基础设施之年”。AI 将不再仅仅是一个对话框,而是深入后台,成为能处理复杂流程、具备“可分发性”的可靠同事。对于所有关注 AI 落地、产品设计和未来工作流的人来说,这是一期不容错过的深度访谈。 时点内容 | Key Topics * Anthropic 的编码基因: 为什么 Anthropic 很早就认定“写代码”不仅是生成软件的工具,更是衡量模型推理和规划能力的核心指标? * Claude Code 的诞生故事: 揭秘这个最初由 Labs 团队开发的内部命令行工具(CLI),如何迅速在公司内部取代其他工具,并最终产品化。 * “Vibe Coding”的兴起: 探讨非技术人员如何利用 AI 构建应用程序(如 Mike 自己在做早饭时顺手写的 Secret Santa 应用),以及这如何改变了软件开发的门槛。 * 中间层的困境: 对于处于“完全小白”和“资深工程师”之间的用户,目前的 AI 工具还存在哪些易用性鸿沟?如何帮助他们通过 AI 爬上“复杂性阶梯”? * 企业 AI 的真相: 回应 MIT 关于“AI 生产力幻觉”的报告——企业不仅需要 AI 生成内容,更需要 AI 生成“高质量且无需大量修改”的内容。 * 2026 年预测:基础设施年 水平智能体 (Horizontal Agents): 从单纯的聊天助手转向能处理 KYC(了解你的客户)等复杂后台流程的智能体。 数据基础设施重构: 企业将不得不重新整理数据存储和标注方式,以适应 AI 的读取和理解。 可分发性 (Distributability): AI 模型需要适应企业现有的复杂云环境和遗留系统,而不是要求企业完全迁就 AI。 * 工具 vs. 同事: 未来的 AI 交互将更像是一种“委托(Delegation)”——你交待任务、提供资源,AI 完成后汇报工作,就像对待人类同事一样。 相关链接与资源: [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
当 2025 年即将结束时,AI 行业兑现了多少承诺?本期 IBM Mixture of Experts 节目汇聚了四位顶尖技术专家,从智能体(Agent)、开源生态、底层硬件到多模态技术四个维度,进行了一场深度的年度复盘与未来推演。 如果说 2024 是大模型的爆发元年,那么 2025 年则是技术深水区的一年。专家们辩论了为什么备受期待的“智能体”似乎在消费者端“销声匿迹”,却又无处不在;探讨了开源模型虽在性能上追平闭源,却为何在用户体验上仍有巨大鸿沟;以及在算力结构性短缺的背景下,专门为 Agent 设计的处理器(Agent Processors)将如何改变 2026 年的硬件格局。无论你是技术决策者还是 AI 开发者,这期对 2026 年的硬核预测都将为你厘清未来的战略方向。 时点内容 | Key Topics * 智能体(Agent)的“隐形”胜利: 回顾 2025:针对“智能体并没有像预期的那样普及”的质疑,专家认为 Agent 并非消失了,而是像 Perplexity Deep Research 或 Claude Code 一样融入了工作流,变成了“隐形”的基础设施。 入口之争:未来的战场不在于独立的 Agent App,而在于谁能成为“超级智能体”的入口——浏览器(如 Chrome, Comet)和手机操作系统将是各大巨头的必争之地。 控制面板:预测 2026 年将出现“智能体控制面板”(Agent Control Plane),用于集中管理和调度分散在不同环境中的 AI 助手。 * 开源 AI 的“Linux 时刻”: 性能 vs. 体验:虽然开源模型(如 Kimi 等)在基准测试上已追平甚至超越闭源模型,但开源界仍缺乏将模型封装为极致用户体验(如“一键生成宝可梦卡片”)的标准软件栈。 2026 预测:开源生态将补齐 UX 和编排层的短板。未来格局将类似操作系统市场:开源模型像 Linux 一样运行在底层服务器和基础设施中,而闭源模型则像 macOS/Windows 一样占据高端用户体验市场。 * 硬件瓶颈与 Agent 专用芯片: 算力两极分化:2025 年确立了算力的结构性短缺,硬件市场分裂为追求极致性能的“Scale Up”(H200/B200 集群)和追求边缘效率的“Scale Out”(量化模型、端侧推理)。 Agent Processors(智能体处理器):专家大胆预测,为了应对 Agent 长时间运行、需要记忆持久化和低延迟规划的特性,2026 年可能会诞生专门优化 Agent 工作负载的新型芯片架构。 * 多模态的务实进化: 模块化多模态:企业级应用不再迷信“万能的大一统模型”(Omni Models),而是转向通过编排(Orchestration)串联多个轻量级、专用的 Adapter(如专门的 OCR 模块、图表分析模块)。 从生成到理解:相比于“文生图”的创意功能,2026 年的企业重点将是“计算机使用”(Computer Use)和复杂文档/图表的数据提取,以服务于更精准的 RAG(检索增强生成)流程。 相关链接与资源: [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
过去的机器人要么是只能在工厂做重复工作的机械臂,要么是在实验室里跌跌撞撞的“醉汉”。而在本期 Google DeepMind 播客中,主持人 Hannah Fry 深度对话了 DeepMind 机器人研究负责人 Carolina Parada,揭示了机器人领域正在发生的巨大飞跃。 通过将 Gemini 的多模态能力引入物理世界,DeepMind 正在构建能听、能看、甚至能理解“灌篮”概念的通用机器人。Carolina 详细解释了他们如何利用**“双系统”架构(System 1 & System 2)**——模仿人类大脑的“快思考与慢思考”,完美解决了大模型推理慢与物理世界要求实时反应之间的矛盾。这不仅是关于机械的故事,更是关于 AI 如何真正获得“常识”并理解物理世界的里程碑。如果你好奇通用机器人何时能进入家庭,这期节目将给出最前沿的答案。 时点内容 | Key Topics * Gemini Robotics 的核心理念: 以前的机器人是被编程来执行特定任务的,现在的目标是构建通用的、能推理的机器人。 * 进化的三个阶段: 从早期的强化学习(叠积木),到引入 LLM(能听懂“我渴了”),再到现在的多模态 Transformer(理解视觉、语言并转化为动作)。 * 双系统架构(快慢思考): System 2 (Slow & Clever): 云端的大模型(Gemini)负责复杂的推理和规划,比如理解“收拾桌子”意味着什么。 System 1 (Fast & Reactive): 端侧的小模型负责毫秒级的实时反应,比如手被挡住时立即避开,无需等待云端指令。 * 超越模仿: 机器人如何通过理解“灌篮”的抽象概念,成功玩弄它从未见过的篮球玩具,而不是单纯的动作复制。 * 灵巧性的突破: 为什么系鞋带、折纸这些对人类很容易的事,对机器人来说却是巨大的挑战?(莫拉维克悖论的讨论)。 * 数据采集的秘密: 研究人员如何通过 VR 头显和手套进行“傀儡操作”(Puppeteering),以第一人称视角教会机器人复杂的精细动作。 * 安全性与阿西莫夫定律: 介绍了 DeepMind 构建的 Asimov 数据集,教机器人理解物理世界的安全边界(例如:为什么不能把毛绒玩具放在热炉子上)。 * Sim-to-Real Gap: 模拟环境与真实世界的差距依然存在,特别是涉及柔性物体(如衣物)和流体时,真实世界的训练依然不可替代。 * 未来的预测: 行业讨论的风向已变——从怀疑“有生之年能否看到通用机器人”,变成了争论“是 5 年还是 10 年”。 相关链接与资源: [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
在 Agent 框架层出不穷的今天,Anthropic 官方推出的 Claude Agent SDK 有何不同?本期节目是 Anthropic 工程师 Thariq Shihipar 的全长 Workshop 实录,深度解析了构建高质量 Agent 的“Anthropic 之道”。 不同于传统的“工具调用(Tool Calling)”模式,Thariq 提出了一个激进且核心的观点:“Bash is All You Need”。他解释了为什么给予 Agent 访问终端和文件系统的权限,比预定义数百个特定工具更具扩展性和鲁棒性。这不仅是 Claude Code 背后的技术栈,也是未来 Agent 开发的新范式。 本期内容涵盖了从理论到实战的全过程: * 核心理念: 为什么 Agent 应该像人类一样使用计算机(Bash、文件系统、编辑器)? * 架构设计: 如何设计高效的 Agent Loop(收集上下文 -> 采取行动 -> 验证工作)? * 实战演示: 通过现场编写一个 Pokemon 数据分析 Agent,展示如何利用 Code Generation(代码生成)解决非编程任务。 * 进阶技巧: 如何利用子智能体(Sub-agents)分担任务,以及如何通过文件系统进行“上下文工程”。 无论你是正在构建 AI 应用的开发者,还是对 Claude Code 幕后技术感兴趣的极客,这堂 Workshop 都将颠覆你对 Agent 开发的认知。 时点内容 | Key Topics * Claude Agent SDK 的诞生: 它是建立在 Claude Code 之上的框架,旨在复用 Anthropic 内部构建 Agent 的最佳实践(如错误处理、工具压缩等)。 * 核心哲学 "Bash is All You Need": 相比于定义无数个僵化的工具(如搜索工具、Lint 工具),Bash 提供了极致的组合性和通用性,是 Agent 的“万能工具”。 * Agent Loop 的三大支柱: 收集上下文 (Gather Context): Agent 像人类一样通过 grep、ls 等命令主动寻找所需信息,而非被动接收。 采取行动 (Take Action): 使用 Bash 或 Code Gen 执行任务。 验证工作 (Verify Work): 这是最关键的一步。Agent 需要能运行代码、检查报错或自我审查,以确保结果准确。 * 工具选择指南: Tools: 适合原子化、高可靠性、不可逆的操作(如发送邮件、写入文件)。 Bash: 适合组合性任务、探索性操作和低上下文消耗的场景。 Code Generation: 适合动态逻辑、复杂数据分析和需要 API 组合的场景。 * 上下文工程 (Context Engineering): 利用文件系统作为 Agent 的记忆和上下文管理工具。 * 技能 (Skills) 与子智能体 (Sub-agents): 如何通过定义 Skills 来“渐进式披露”复杂任务的指南?如何利用 Sub-agents 并行处理任务并保护主上下文不被污染? * 安全性 (The Swiss Cheese Defense): 通过模型对齐、工具解析器(Parser)和网络/文件系统沙盒(Sandboxing)构建多层防御体系。 * 现场实战 (Live Prototyping): 演示如何从零开始构建一个 Pokemon Agent,利用代码生成来查询 API 并分析数据,展示了从简单 Prompt 到复杂 Agent 的演进过程。 相关链接与资源: [视频来源]www.youtube.com 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
在 AI 语音生成领域,ElevenLabs 无疑是当今最耀眼的独角兽。本期节目,a16z 合伙人 Jennifer Li 深度对话 ElevenLabs 联合创始人兼 CEO Mati Staniszewski。 Mati 分享了 ElevenLabs 从波兰单调的电影配音痛点出发,一路成长为拥有 10000 种声音、支付给社区 1000 万美元报酬的语音生态平台的故事。您将了解到: * 技术与产品的平衡: ElevenLabs 如何在保持 20 个小团队(每个 5-10 人)独立运作的同时,实现惊人的发布速度和质量控制? * 全球化人才策略: 为什么 Mati 认为欧洲团队比美国团队更有激情?他们如何发掘那些“白天在呼叫中心接电话,晚上写开源代码”的非典型人才? * 商业模式的进化: 从服务个人创作者到深入医疗、电信等企业级市场,ElevenLabs 如何解决合规、版权(如与四大唱片公司的 18 个月谈判)和信任问题? * 组织管理的艺术: 为什么取消所有职级头衔(Title)反而促进了扁平化管理?在公司扩张到 350 人时,如何调整销售激励以避免“为了佣金卖给竞争对手”的乌龙? 无论你是 AI 创业者、产品经理,还是关注生成式 AI 商业落地的投资者,这期对话都将为你揭示一家顶尖 AI 应用公司的内部运作机制和未来愿景。 时点内容 | Key Topics * ElevenLabs 的起源: 两位波兰联合创始人如何因无法忍受本国单调的电影配音(所有角色都由同一人毫无感情地朗读)而萌生创业想法,并最终将其转化为全球领先的 AI 语音模型。 * 速度与质量的护城河: 拥有 20 个独立的产品团队,每个团队仅 5-10 人。如何通过设定“六个月产品与市场契合(PMF)期限”来保持初创公司的敏捷性? * 研究与产品的博弈: 面对用户对“语速滑块”的需求,技术团队坚持通过模型研究解决,而产品团队最终通过简单的工程手段快速满足用户——如何在理想主义与实用主义之间做取舍? * 非传统招聘: 招聘了一位在呼叫中心工作却拥有顶级开源 TTS 项目的开发者;分享了为什么欧洲人才在某些方面比硅谷人才更具饥饿感和忠诚度。 * 版权与创作者经济: 建立了 Voice Marketplace,让声音所有者获得收益(已支付 1000 万美元)。 * 与音乐行业的艰难谈判: 历时 18 个月与环球、索尼等四大唱片公司达成协议,通过设定“强制时间点”(Forcing Function)来推动合作进程。 * 企业级转型: 从 PLG(产品驱动增长)向企业销售转型。分享了医疗公司 Hippocratic 如何利用 ElevenLabs 构建能够自动打电话提醒病人吃药的 AI Agent。 * 扁平化管理实验: 取消了公司内部的所有头衔(Titles),让“Go-to-market”团队只是团队,而不是 VP 或 Director,以此鼓励跨职能的流动和贡献。 * 销售激励的陷阱: 随着团队扩张,如何发现并修正销售佣金制度中的漏洞(例如,为了佣金想把模型授权给基础模型竞争对手),并建立明确的政策护栏。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=ZqCEHR4wjxg 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
Notion 如今已是估值超 100 亿美元、年收入(ARR)超 5 亿美元的超级独角兽,但在 2015 年,它曾濒临倒闭。当时的 Notion 现金流耗尽,产品建立在随时可能崩溃的单一数据库上,团队面临解散的危机。 本期节目带我们走进 Notion 的幕后,对话联合创始人 Simon Last 和 COO Akshay Kothari。他们揭秘了那段最黑暗的时光——创始人如何破釜沉舟搬到日本京都,在完全不懂语言的环境下通过 18 小时的每日编程重建了产品。 更重要的是,本期节目深入探讨了 Notion 3.0 的核心战略:全面拥抱 AI 代理(Agents)。Notion 内部目前拥有 560 个活跃的自定义 Agent,这意味着每两个员工就配备了一个 AI 助手。他们如何看待未来的工作形态?为什么说未来的每个人都将成为“AI 代理的管理者”?这是一次关于创业韧性、产品哲学与未来工作方式的深度探秘。 时点内容 | Key Topics * 濒死体验与京都重生: 回顾 2015 年 Notion 耗尽资金的危机时刻。创始人 Ivan 和 Simon 选择搬到京都,在与世隔绝的环境中重写代码,将“品味”(Taste)作为产品的核心护城河。 * 从 100 万到 5 亿 ARR 的扩张: COO Akshay 分享从 8 人团队增长到 1000 人大厂的挑战,以及在 TikTok 爆火导致服务器险些崩溃的惊险瞬间。 * COO 的自我毁灭哲学: Akshay 认为 COO 的工作就是不断“把自己炒鱿鱼”——先身兼数职(销售、财务、法务),然后招人替代自己,最终专注于最核心的战略。 * AI 时代的 Notion 3.0: Notion 不再仅仅是文档或数据库,而是致力于成为“知识工作者的 AI 基础设施”。 * 内部数据大公开: Notion 内部目前有 560 个活跃的自定义 AI Agent,相当于每两名员工就有一个 Agent 在后台处理重复性工作。 * 未来工作形态预测: 人类的角色将从“执行者”转变为“协调者”。未来的工作不是自己动手做所有事,而是管理和审计一群日益复杂的 AI 智能体群(Swarms of Agents)。 * “柔软”的软件哲学: 即使在 AI 时代,Notion 依然坚持软件应该是“可塑的”(Malleable)和“柔软的”,让用户像搭积木一样自定义自己的工具,而不是被僵化的 SaaS 流程所束缚。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=l8xdRcN81x8 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。 附录: Notion 的创始人 Ivan Zhao 的精彩文章:《钢铁、蒸汽机与无限大脑》 越来越清晰的感觉到,我们正处于 AI 革命的早期阶段,对于未来谁也不知道会怎么样,所以都喜欢从历史中、去工业革命、互联网革命中寻找规律,以期望能对未来有所启发。 相对来说,这篇文章虽然也是尝试从钢铁和蒸汽机的历史里,寻找 AI 时代的答案,还是挺有深度。 【1】第一个观点是:我们正在看着后视镜开车 每一代新技术刚出来时,人们总是习惯用旧的方式去理解它。这就是所谓的“看着后视镜驶向未来”。 想想看,早期的电话,大家把它当成“会说话的电报";早期的电影,其实就是把摄像机架在观众席拍舞台剧。 现在的 AI 也是一样。我们看到的 AI 大多长什么样?一个聊天框。为什么?因为它在模仿 Google 搜索框。 我们正处在这个尴尬的过渡期。就像当年大家还不懂电影剪辑语言一样,我们现在还在试图把 AI 硬塞进旧的工作模式里。 【2】个人层面:从骑自行车到开汽车 乔布斯当年有个著名的比喻,说电脑是“大脑的自行车"。意思是它能让人跑得更快,但你还得自己蹬。 对于现在的程序员来说,AI 已经不是自行车了,而是汽车。你不用蹬了,你只需要握好方向盘。 Ivan 讲了他的联合创始人 Simon 的故事。 Simon 以前是传说中的“10 倍工程师",但现在几乎不自己写代码了。路过他工位,你会看到他像指挥官一样同时调度三四个 AI 编程智能体。这些 AI 不只打字快,还能思考。他在吃饭或睡前把任务排好队,AI 就在后台疯狂干活。 他从“写代码的人",变成了“管理无限大脑的人"。 【3】为什么只有程序员先享受到了从骑自行车到开汽车的待遇? 但问题来了,为什么只有程序员先享受到了这种待遇?普通的文案、运营、产品经理为什么还在“蹬自行车"? 两个原因: 第一,上下文太碎了。程序员的代码都在仓库里,环境单纯。 但普通人的工作散落在 Slack、飞书、文档、甚至脑子里。AI 不知道前因后果,没法干活。 第二,没法验证。代码写错了会报错,好坏一目了然。 但一个活动策划案好不好?一份周报写得对不对?这很难量化。 所以,想要从自行车升级到汽车,我们得先帮 AI 把上下文补齐,并且找到验证工作成果的方法。 【4】组织层面:不仅是换引擎,还要换地基 个人层面说完,Ivan 把视角拉到组织层面,用了“钢铁"和“蒸汽机"两个比喻,来解释 AI 会如何重塑公司。 第一个是钢铁。 在钢铁普及之前,房子盖不高。因为用砖头和木头,盖到六七层,底下的墙就被压垮了。这就像现在的公司,人数一过几百,沟通成本就爆炸了,效率急剧下降。人与人之间的沟通,就是那个脆弱的“砖墙"。 AI 就是组织的“钢铁"。它能支撑起巨大的信息流,让决策不需要层层汇报就能完成。未来的公司,可能几千人规模还能像创业团队一样敏捷,因为 AI 撑住了沟通的架构。 第二个是蒸汽机。 最早的工厂都建在河边,因为要用水车做动力。蒸汽机刚发明时,很多老板只是把水车拆了,换成蒸汽机,但工厂还在河边,流程也没变。效率提升非常有限。 直到后来,老板们意识到: “等一下,既然不用水了,我为什么不把工厂搬到离港口更近的地方?" 工厂可以建在离工人、港口、原材料更近的地方。整个车间可以围绕蒸汽机重新设计。后来电力普及,工厂进一步把集中的动力轴拆散,给每台机器配上独立的电机。生产力才真正爆发,第二次工业革命才真正起飞。 我们现在还在“换水车"阶段。AI 聊天机器人挂在现有工具上,工作流程还是为人设计的。我们还没认真想过:如果旧的约束消失了,组织应该长什么样? 真正的变革,是当管理者意识到可以彻底重组工作流,让那些“不睡觉的大脑"去处理所有重复性工作的时候。 Notion 自己就在做实验。他们 1000 人的公司里,活跃着 700 多个 AI Agent。这些 AI 负责写会议纪要、回答内部咨询、处理 IT 请求、写周报。这不仅仅是省时间,这是在重塑组织形态。 回看你的工作,如果只是用 ChatGPT 润色邮件,那你就是在把水车换成蒸汽机,工厂还在河边。试着想一想:如果我有无限个免费实习生(AI),工作流程应该怎么彻底重设计? 【5】经济层面:从佛罗伦萨到东京 最后 Ivan 把视角再拉高一层:钢铁和蒸汽不只改变了建筑和工厂,还改变了城市。 几百年前,城市是人类尺度的。佛罗伦萨走个四十分钟就能穿城而过,生活节奏由人能走多远、声音能传多响决定。然后钢铁框架让摩天楼成为可能,蒸汽铁路把市中心和腹地连起来,电梯、地铁、高速公路跟上。城市在规模和密度上爆发了。东京、重庆、达拉斯,这些不是“更大版本的佛罗伦萨",而是完全不同的生存方式——更混乱、更匿名、更难辨认方向,但也提供了更多机会和自由。 Ivan 认为知识经济正站在同样的转折点上。今天的知识工作占了美国 GDP 的近一半,但大部分还是人类尺度的运作:几十人的团队,会议和邮件定义的节奏,超过几百人就开始失灵的组织。我们用石头和木头建造了很多佛罗伦萨。 当 AI 智能体大规模上线,我们会开始建造东京。成千上万的智能体和人类协作,工作流程全天候运转不等人醒来,决策在恰到好处的人类参与下被综合。周会、季度规划、年度考核的节奏可能不再合理,新的节奏会涌现。 我们将失去一些“小而美"的清晰感,但会换来前所未有的规模和速度。 Ivan 提到一个历史趣事:1865 年英国有个《红旗法案》,规定汽车上路时必须有人举着红旗走在前面开路。听起来荒谬,但我们现在要求 AI 每做一步都要人确认,是不是也像“举红旗"?真正的未来,是人站在更高处监管,而不是挡在路中间。 也许我们应该停止从后视镜看世界,开始想象新的可能。卡内基看着钢铁,看到了城市天际线。兰开夏郡的工厂主看着蒸汽机,看到了不再依赖河流的车间。 我们还在问 AI 怎么当好“副驾驶"。也许该问的是:当无限心智成为基础设施,知识工作会变成什么样? 这个问题,Ivan 没给答案。但他给了一个思考的框架。对于正在这场变革中的人来说,框架可能比答案更有用。
本期节目,Lenny 独家对话 OpenAI Codex 的产品负责人 Alexander Embiricos。在 GPT-5 发布后的几个月里,OpenAI 的编码智能体 Codex 经历了爆发式增长。Alexander 分享了 Codex 如何从一个模型代号重生为 OpenAI 最核心的“软件工程师队友”。 这不仅是一次产品访谈,更是对 2026 年 AI 发展趋势的深度预演。你将听到 OpenAI 内部令人咋舌的开发速度——仅用 2-3 名工程师和 18 天就构建了霸榜 App Store 的 Sora Android 应用。Alexander 还深入探讨了为什么 AI 发展的当前瓶颈不再是算力,而是人类的“打字速度”和“审查速度”;以及 OpenAI 正在构建的神秘浏览器项目 Atlas。无论你是开发者、产品经理,还是关注 AGI 进程的观察者,这期内容都将带你提前看到 AI 协作的未来形态。 时点内容 | Key Topics * Codex 的重生: 为什么 OpenAI 决定重启“Codex”品牌?它不再仅仅是 Copilot 背后的模型,而是一个包含 VS Code 插件和 CLI 工具的完整编码智能体。 * Sora App 的疯狂开发: 揭秘 Sora Android 应用的开发内幕——利用 Codex 进行代码移植和生成,仅用 18 天完成内部版,28 天正式上线并登顶 App Store。 * Atlas 浏览器: OpenAI 正在构建名为 Atlas 的浏览器?Alexander 解释了为何要进入浏览器领域,以及“上下文感知”如何让 AI 在网页工作中更主动地提供帮助。 * AI 的新瓶颈: 一个反直觉的观点:目前限制 AGI 发展的最大因素是人类的打字速度和多任务处理能力(主要是为了审查 AI 的工作)。 * 从助手到队友: 未来的 Codex 不仅仅是写代码,还能像真正的实习生一样,自我修复训练运行中的错误(On-call),甚至主动在 Slack 上回答数据波动的问题。 * 压缩人才栈(Compressing the Talent Stack): 设计师通过“Vibe Coding”直接生成动画代码,产品经理直接修改文案字符串——AI 如何模糊了传统职能的边界? * AGI 时间表与 2026 预测: Alexander 预测 2026 年将是 Agent 真正爆发的一年,并给出了他对 AI 发展“曲棍球棒”曲线的看法。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=z1ISq9Ty4Cg 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
在 AI 辅助编程普及的今天,许多公司虽然有 90% 的工程师在使用 Copilot,但依然保留着传统的开发流程。本期节目,我们邀请到媒体兼软件公司 Every 的 CEO Dan Shipper,他分享了一个激进的观点:90% 的 AI 采用率和 100% 的 AI 采用率之间存在着 10 倍的效率差距。 Dan 详细展示了 Every 作为一个仅有 15 人的团队,如何在不融资的情况下,仅靠单人开发者就构建并维护了 Kora、Monologue 等 4 个复杂的商业化软件产品。这背后的秘密在于他们彻底重构了工程流程,提出了**“复利工程”(Compounding Engineering)**的新范式——让 AI 编写 99% 的代码,并将每一次开发经验都固化为全公司共享的资产。你将看到 AI 如何让新员工入职第一天就提交代码,如何让不同技术栈的团队无缝协作,甚至让 CEO 利用碎片时间重回代码一线。 时点内容 | Key Topics * 100% AI 采用率的质变: 为什么说只要有 10% 的流程停留在旧时代,就会拖累整个组织的效能?从“辅助编码”到“全权委托”的思维转变。 * Every 的疯狂实验: 15 人团队运营 6 个业务单元和 4 个软件产品,且每个 App 仅由一名开发者构建,99% 代码由 AI 生成。 * 复利工程(Compounding Engineering): 只有 AI 时代才可能实现的工程新哲学。 目标: 让开发的每一个功能都使下一个功能的开发变得更容易。 四步循环: 计划(Plan)、委托(Delegate)、评估(Assess)、固化(Codify)。 核心动作 Codify: 将隐性知识(Tacit Knowledge)转化为全公司共享的 Prompts 和 Agent 配置文件。 * 组织架构的二阶效应(Second-order Effects): 隐性代码共享: 不需要复杂的库封装,AI 可以直接读取同事的代码并为你在新栈中复现逻辑。 新员工即插即用: 所有的环境配置和规范都已写入 Agent,新员工第一天即可高效产出。 跨项目贡献(Internal Open Source): 任何开发者甚至管理者都能轻松修复其他产品的 Bug,因为理解代码的成本几乎为零。 技术栈自由: 不再需要强制统一语言,AI 让 Python 和 Node.js 开发者之间的隔阂消失。 管理者的回归: 利用 AI 这种“注意力碎片化”工具,CEO 也能在会议间隙修复 Bug 或提交功能,重获对产品的掌控感。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=MGzymaYBiss 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
搜索栏正在消亡,消费者的购物习惯正经历一场从“搜索与浏览”到“提问与购买”的根本性重塑。当 ChatGPT 为 Zara 和 H&M 带来的流量占比甚至超过传统广告时,我们正站在一个价值 3850 亿美元的“代理商务(Agentic Commerce)”市场的入口。 本期节目揭示了这场 AI 购物革命背后的底层逻辑:流量套利(Arbitrage)已从“注意力”转向了“信任”。AI 正逐渐成为消费者与产品之间最受信任的中间人。我们不仅会分析为什么大企业虽然看到了趋势却难以转身,更会为你提供三个具体可执行的商业模式,助你在 2026 年利用 AI 工具以极低的成本和极快的速度建立竞争优势,无论是打造 AI 原生品牌、构建垂直领域的购物代理,还是成为新兴的 GEO(生成式引擎优化)专家。 时点内容 | Key Topics * 搜索栏的消亡与信任套利的崛起: 消费者不再搜索关键词,而是向 AI 寻求直接的解决方案。AI 的推荐比付费广告更具公信力,标志着商业竞争的核心从争夺注意力转向争夺 AI 的信任。 * 商业模式一:AI 原生电商品牌(AI First E-commerce Brand): 极速验证: 利用 Nano Banana 2 等图像模型在一个下午生成并测试数百个产品概念,无需预先制造。 内容工厂: 全自动生成产品图、视频广告和社交媒体内容,无需摄影师和工作室。 低成本运营: 利用现成的 AI 客服代理实现 24/7 服务,以极低的日常开销对抗传统巨头。 * 商业模式二:垂直领域的 AI 购物助手(Niche AI Shopping Assistant): 避开通用大模型: 不要试图做一个“万能导购”,通用 AI 什么都懂但什么都不精。 深耕价值型需求: 针对道德供应链、纯素食主义者等特定群体,构建基于规则和深层数据的专用代理(如使用 n8n 等低代码工具),提供通用模型无法给予的深度验证和信任。 变现路径: 通过订阅费或高额佣金实现盈利,是一次构建、无限服务的“产品化服务”。 * 商业模式三:生成式引擎优化服务(GEO - Generative Engine Optimization): 新时代的 SEO: 帮助品牌优化其在线资产,使其更容易被 AI 模型理解和推荐。 蓝海市场: 目前全球精通此道的专家极少。工作内容包括重写产品描述、添加结构化数据,确保品牌在 ChatGPT 等平台的回答中占据“首推”位置。 持续性收入: 这不是一次性的修复,而是需要长期维护的月费制服务。 * 数字地产的重要性: 在 AI 时代,拥有一个清晰、可信的域名(如 .store)是向 AI 和用户传递“我是专业卖家”这一信号的关键,其带来的信任感直接转化为转化率。 * 未来的机会所在: 真正的机会不在于开发大模型,而在于成为“系统架构师”——将强大的 AI 工具应用于现实世界的细分问题,从执行者转变为品味把控者和系统设计者。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=Lw5Gy881PJ8 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
在 AI 领域,Chip Huyen 是少有的既具备顶尖学术背景(斯坦福讲师、Netflix/NVIDIA 研究员),又能深入企业一线解决实际问题的实战派专家。她撰写的《AI Engineering》不仅是畅销书,更是无数开发者的案头指南。 本期节目,Lenny 与 Chip 进行了一场硬核而深度的对话,直击 AI 应用开发的痛点。Chip 犀利地指出,大多数公司在 AI 转型中陷入了误区:过度迷恋最新的模型和新闻,却忽视了数据质量和用户需求这些“枯燥”但决定成败的基础工作。 您将了解到: * 戳破泡沫: 为什么 Chip 认为“紧跟 AI 新闻”往往是浪费时间?她那张刷屏的“认知偏差图”背后,揭示了构建 AI 产品时哪些工作才是真正的高杠杆。 * 技术祛魅: 用最通俗的语言拆解预训练(Pre-training)、后训练(Post-training)、微调(Fine-tuning)和 RLHF 的本质区别。 * RAG 实战心法: 为什么在检索增强生成(RAG)中,数据准备(Data Prep)远比选择哪个向量数据库重要? * 工程师的未来: AI 会取代初级工程师还是让资深工程师更强大?Chip 分享了关于“系统思维”(System Thinking)为何是未来核心竞争力的独到见解。 * 跨界思考: 从撰写技术书籍到创作虚构小说,Chip 如何通过跨界写作来提升对用户心理的感知力? 无论你是正在构建 AI 应用的工程师、产品经理,还是关注技术趋势的决策者,这期节目都能帮你拨开迷雾,找到 AI 工程化的正确路径。 时点内容 | Key Topics * AI 开发的认知偏差: 深入解读那张病毒式传播的图表——人们以为重要的是最新的 Agent 框架和模型对比,但实际上真正重要的是与用户交谈、构建可靠的平台和准备更好的数据。 * 预训练 vs. 后训练: 形象地解释预训练就像学习语言统计规律,而后训练(微调/RLHF)则是通过强化学习让模型掌握特定任务或领域知识。 * RAG(检索增强生成)的关键: 许多团队过度纠结于数据库选型,却忽略了数据分块(Chunking)、元数据管理和文档重写等“数据准备”工作,而这才是提升检索质量的根本。 * 评估(Evals)的艺术: 为什么在大规模应用中必须要有严格的评估体系,但在产品早期“凭感觉”(Vibes)可能就足够了?如何设计有效的评估指标? * AI 对生产力的真实影响: 分享了一个有趣的实验——将工程师分为高中低绩效三组,发现 AI 工具对高绩效工程师的提升最大,因为他们更具备解决问题的能力。 * 未来的核心技能:系统思维: 随着 AI 接管越来越多的代码编写工作,计算机科学教育将从“教你写代码”转向“教你设计系统”和解决问题。 * 组织架构的变革: AI 正在打破产品、工程和设计之间的界限,未来的团队将更加融合,甚至出现“全栈构建者”。 * 个人哲学与写作: Chip 分享了她的人生格言“Nothing really matters”(虚无主义带来的自由感),以及通过写小说来训练“预测读者反应”的能力,这对做产品同样适用。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=qbvY0dQgSJ4 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
在大多数企业还在争论 AI 是否过度炒作时,Block(原 Square)已经通过内部自研的 AI Agent "Goose" 实现了惊人的效率提升。本期节目,我们邀请到了 Block 的首席技术官 Dhanji R. Prasanna,深度解析这家金融科技巨头如何转型为 AI 原生企业。 Dhanji 分享了 Block 如何通过组织架构重组(从 GM 结构转为职能结构)来打破部门壁垒,为 AI 的全面落地铺平道路。最令人兴奋的是,他详细介绍了基于开源协议 MCP 构建的 Goose——这不仅仅是一个聊天机器人,更是一个能操作数据库、编写代码、甚至自动优化日程的智能体。目前,Block 的 AI 前沿团队每周能节省 8-10 小时的工作时间。 此外,Dhanji 还分享了他从 Google Wave、Google+ 到 Cash App 的职业生涯中汲取的宝贵教训,探讨了为什么“代码质量”往往与产品成功无关,以及为何初级员工和非技术人员反而是 AI 浪潮的最大受益者。无论你是正在探索企业 AI 落地的管理者,还是对 Agentic AI 感兴趣的开发者,这期节目都将为你提供一份来自一线的实战蓝图。 时点内容 | Key Topics * Block 的 AI 宣言与转型: Dhanji 如何通过一封致 Jack Dorsey 的信推动公司转型,以及为何将公司重组为职能型架构(Functional Org)是实现技术聚焦的关键。 * Goose:企业级 AI Agent 实战: 深入介绍 Block 内部开源的 AI 智能体 Goose。它如何基于 MCP(Model Context Protocol)连接 Snowflake、Tableau 等工具,自动生成营销报告、编写代码甚至管理日历。 * 真实的 AI 效率数据: 尽管外界对 AI 生产力存疑,Block 的数据显示 AI 前沿团队每周节省 8-10 小时,全公司平均节省 20-25% 的手动工作时间。 * 非技术人员的 AI 赋能: 令人惊讶的发现——非技术团队(如风险管理、法务)利用 AI 构建工具的积极性和收益往往超过工程师,实现了从“等待排期”到“自主开发”的跨越。 * 代码质量的迷思: 结合 YouTube 和 Google Video 的案例,Dhanji 提出了一个反直觉观点:代码质量与产品成功几乎无关,过度追求架构完美反而可能阻碍价值交付。 * Vibe Coding 与未来编程: 探讨从“乒乓式”对话编程到“自主式”异步编程的转变。未来,工程师可能在睡前布置任务,醒来后审核 AI 连夜完成的多个实验版本。 * 从小事做起(Start Small): 无论是 Cash App、比特币产品还是 Goose,Block 的许多核心产品都源于黑客松或个人的小实验。 * 失败的教训: 回顾 Google Wave 和 Secret 等产品的失败经历,强调在产品开发中“接触地气”和验证核心假设的重要性。 * 给管理者的建议: 亲自使用 AI 工具(Get your hands dirty),不要只看报告;在某些情况下,最好的优化是质疑流程本身的存在必要性,而非用 AI 自动化它。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=JMeXWVw0r3E 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
时尚独角兽 Polyvore 的 CEO,再到如今红杉资本(Sequoia Capital)的合伙人兼首席产品官,Jess Lee 的职业生涯是一部教科书式的“打怪升级”史。本期 Delphi 播客中,她不仅分享了自己在 Google 只有“工程师思维”时的惨痛教训,还坦诚剖析了作为 CEO 时在商业模式选择上的重大失误。 这期内容对于创业者和产品人来说极具含金量。Jess 揭示了红杉看重创始人的核心特质——速度(Velocity)与讲故事的能力,并提出了一个评估人才的新框架(不仅看 IQ/EQ,还要看 PQ 和 JQ)。更令人耳目一新的是她对 AI 消费级应用的“非共识”判断:当所有人都在唱衰媒体投资时,她为何坚信 AI 生成的“微短剧”将诞生下一个 YouTube 或 Netflix?这是一场关于领导力、商业直觉与未来媒体形态的深度对话。 时点内容 | Key Topics * 人才评估新框架: 除了智商(IQ)和情商(EQ),高阶人才还需要政治商数(PQ,处理组织关系的能力)和判断力商数(JQ,商业决策的准确性)。 * Google 的成与败: Google 的伟大在于极致的工程文化和宏大的野心(如街景项目),但早期的失败案例(如分类广告项目)教训惨痛——因为缺乏早期的客户探索,导致做出了“除了结构化搜索没人想要”的产品。 * 从打杂到 CEO: Jess 分享了她在 Polyvore 如何通过“志愿主义”(主动承担没人做的杂事)从一名普通 PM 晋升为 CEO,以及如何克服伴随而来的冒名顶替综合症。 * CEO 的百万美元教训: 回顾 Polyvore 的最大遗憾——选错了商业模式。她深刻反思了为何当初为了追求交易额(GMV)而放弃了类似 Figma 的设计工具路径,导致陷入了低复购的电商困境,而非高利润的 SaaS 模式。 * 社区建设的艺术: 如何通过高接触服务(High-touch)建立邪教般的粉丝忠诚度?比如给用户送上他们收藏已久却买不起的那件单品。 * 红杉的投资视角: 速度至上: 创业就像翻牌游戏,唯一能控制的就是翻牌的速度(迭代速度)。 故事即生产力: 创始人必须像“邪教领袖”一样,用非理性的梦想吸引人才和资本。 * AI 消费应用的未来: 反驳“媒体已死”的观点,看好 AI 驱动的娱乐内容。她预测 AI 生成的微短剧(如“哈利波特版宿醉”)将演变成巨大的新媒体平台,创造出新一代的创作者阶层。 * 团队组建哲学: 寻找“有尖刺”(Spiky)的人才。不需要全能型选手,而是将一个极具创意但混乱的 PM 与一个极度有条理的设计师配对,通过互补实现卓越。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=AmHNJbFlltk 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧