播客无国界 - 节目列表

EP159:AMP 大变革-为什么我们要杀死 VS Code 插件并拥抱 CLI?

播客无国界

软件开发正在经历一场前所未有的范式转移。本期节目中,AMP 的 CEO Quinn Slack 和联合创始人 Torsten 宣布了一个震撼业界的决定:AMP 将在 60 天内彻底关停其 VS Code 编辑器插件,全面转向 CLI(命令行界面)。 这是一个关于“自杀式创新”的故事。他们认为,传统的“人与 AI 在侧边栏对话”的模式已经过时,未来的开发者将不再是代码的编写者,而是 AI Agent 工厂的管理者。本期深入探讨了新发布的 Deep Mode(基于 GPT-5.2 Codex)如何改变工作流——从实时的“乒乓”交互转向长周期的“深度思考与执行”。如果你想知道为什么未来的 1% 顶尖开发者只需要在编辑器里完成 1% 的工作,以及如何构建一个能自我进化的 AI 原生代码库,这期节目绝对不容错过。 时点内容 | Key Topics * Deep Mode 发布: 介绍了基于 GPT-5.2 Codex Medium 的新模式。与 Opus 4.5 的“急于表现”不同,Deep Mode 更像是一个深思熟虑的研究员,适合处理长周期(45-60 分钟)、复杂的任务,这就是“工厂模式”的雏形。 * 侧边栏已死 (Sidebar is Dead): 宣布将在 60 天内关停 AMP 的 VS Code 插件。理由是这种交互方式限制了 AI 的并行处理能力,且让人类成为了瓶颈。未来的开发应在 CLI 中完成,通过并行启动多个 Agent 来极大提升效率。 * 技能 (Skills) 的崛起: 解释了为什么“Skills”成为了 AI 开发中的核心抽象。从简单的 tmux 命令技巧到复杂的 BigQuery 查询,将人类的隐性知识固化为 Agent 可调用的技能,是提升 AI 表现的关键。 * 为 Agent 优化代码库: 分享了 AMP 团队为了适应 AI 开发而做出的牺牲——甚至不惜降低人类开发体验(如改用对 AI 更友好的测试命令 pnpm test),以换取 Agent 的极速执行。 * 上下文管理的终结: 提出随着模型能力的提升(特别是 GPT-5.2),手动管理上下文窗口(Context Window)的时代即将结束。未来的模型将能够自动处理长上下文,用户无需再为“何时开启新对话”而焦虑。 * 软件的液态化: 讨论了 App 和 SaaS 的消亡。未来的软件可能不再是固定的应用程序,而是由 Agent 根据需求实时生成的临时界面或脚本(如根据照片自动生成健身计划网页)。 * 激进的创新哲学: AMP 团队只有 19 人,全员编码。他们认为在 AI 时代,必须像“艺术装置”一样不断自我毁灭和重建,每三个月重塑一次产品,才能在快速变化的技术浪潮中生存。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=4rx36wc9ugw 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

49分钟
99+
2个月前

EP158:Vibe Coding 入门指南:如何用自然语言“写”出爆款应用

播客无国界

你是否曾因为不懂代码而放弃过伟大的产品想法?Greg Isenberg 在本期视频中揭示了编程领域的一场新革命——Vibe Coding(直觉编程/氛围编程)。 正如 AI 大神 Andrej Karpathy 所说,我们正处于一个无需精通语法、只需专注于逻辑和自然语言描述就能构建软件的时代。本期节目不仅是一个概念普及,更是一场硬核实战:Greg 从零开始,现场演示了如何利用 Replit Agent、Cursor Composer 和 v0 这三大 AI 神器,在几分钟内构建出一个包含 Flask 后端、文章抓取、AI 摘要生成甚至暗黑模式的 Hacker News 阅读器。无论你是零基础小白还是资深开发者,这期内容都将彻底颠覆你对软件开发的认知,让你在看完视频后就忍不住想去“写”点什么。 时点内容 | Key Topics * Vibe Coding 的定义与起源:解释了由 Andrej Karpathy 提出的“Vibe Coding”概念——即完全放弃对代码细节的纠结,专注于用自然语言描述逻辑和“氛围”,让 AI 完成所有繁重工作。 * 工具一:Replit Agent (从 0 到 1 的神器):演示如何使用 Replit 的浏览器端 Agent,通过简单的自然语言指令(Prompt),从零构建一个全功能的 Web 应用(Greg's Hacker News Reader)。重点展示了它如何自动处理环境配置、依赖安装和部署。 * 实战演示:构建 Hacker News 阅读器:详细展示了通过 Replit Agent 构建应用的完整流程: Prompt:创建一个 Flask 应用,抓取 Hacker News 首页。 迭代:要求 AI 用 LLM 总结文章内容,且限制在 20 字以内。 美化:添加极简主义设计风格(橙黑配色)和暗黑模式切换功能。 * 工具二:Cursor Composer (现有代码的进化):介绍了 Cursor 编辑器及其核心功能 Composer。演示了如何在现有代码库中,通过自然语言指令快速添加新功能(如在网站上添加五彩纸屑特效),适合对代码有一定掌控欲的用户。 * 工具三:v0 by Vercel (UI 设计大师):展示了 v0 在前端界面生成方面的强大能力。演示生成一个“90 年代复古赛博朋克仪表盘”,无需编写一行 CSS,直接通过对话生成高质量 UI 组件。 * 工具选择指南:总结了三个工具的最佳适用场景——Replit 适合从零开始的完整应用构建与托管;Cursor 适合在现有项目中进行快速迭代和修改;v0 适合生成精美的前端界面和组件。 * 未来的编程语言是英语:强调了编程门槛的消失,鼓励所有人利用这些工具将创意转化为现实,唯一的限制只剩下了你的想象力。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=qwmmWzPnhog 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

46分钟
99+
2个月前

EP157:从单兵作战到团队协作-Claude Code Agent Teams 深度技术拆解与安装指南

播客无国界

本期视频深入解析了 Claude Code 最新推出的 Agent Teams 功能。这是一个重大的升级,它允许用户启动多个 Claude Code 实例,协同完成复杂的任务和项目,并且这些实例之间可以通过特定的协议进行通信。 视频作者 AI Jason 通过逆向工程,深入挖掘了 Agent Teams 的底层工作原理,包括新的工具集(如 team_create, task_create, task_update, send_message 等)、通信协议以及文件系统结构。这不仅仅是一个安装指南,更是一次技术深潜,帮助开发者理解何时使用 Agent Teams 而非简单的 Sub-agent。 你将了解到: * 如何启用 Agent Teams: 详细的配置步骤,包括修改 settings.json 和使用 tmux/iTerm2 进行多会话管理。 * 底层架构解析: 详细拆解了 Agent Teams 的工作流程,从创建团队、分配任务、启动子智能体到智能体间的通信机制。 * 通信与协作机制: 解释了主智能体(Team Lead)与子智能体(Teammates)之间,以及子智能体相互之间如何通过文件系统和消息传递工具进行协作。 * 实战应用案例: 展示了一个利用多智能体团队进行复杂 Bug 调试的案例,通过让不同智能体提出假设、相互辩论和验证,最终达成共识,解决了单智能体容易陷入局部最优解的问题。 时点内容 | Key Topics * Claude Code Agent Teams 简介与安装 介绍 Agent Teams 功能:多实例协同、通信协议。 安装步骤:更新 Claude Code 至 2.1.34+,修改全局 settings.json 开启实验性功能 agent_teams。 使用建议:推荐使用 tmux 或 iTerm2 的 Python API 功能,以便在分屏视图中实时监控不同智能体的操作。 * Agent Teams 核心工作原理逆向 Team Create (团队创建): 主智能体调用 team_create 工具,在 .claude/teams 目录下生成配置文件,定义团队结构。 Task Create (任务创建): 主智能体调用 task_create 工具,生成任务列表 JSON 文件,包含任务描述、状态及依赖关系(blocked by)。 Task Tool (任务分配): 升级版的 task 工具,不仅能启动任务,还能指定团队名称和成员名称,从而启动一个新的 Claude Code 会话(Session)。 * 智能体协作与通信机制 Task Update (任务更新): 子智能体使用 task_update 工具更新任务状态(进行中、完成等)及依赖关系。 Send Message (发送消息): 子智能体可以使用 send_message 工具与 Team Lead 或其他 Teammates 通信。支持点对点消息和广播消息。 Shutdown Request (关闭请求): Team Lead 可以通过发送 shutdown_request 来终止子智能体的会话。 消息传递实现: 通过在 .claude/teams/inbox 目录下读写文件,并将新消息作为 User Message 注入到对方的对话历史中实现。 * 实战案例:多智能体辩论式 Debug 展示了一个复杂的 Bug 调试场景。 主智能体创建任务列表,启动 5 个子智能体分别验证不同的假设。 子智能体之间通过广播消息分享发现、相互辩论(类似科学辩论),并尝试反驳对方的理论。 最终所有智能体达成共识,主智能体汇总结论,比单智能体调试更深入、更全面。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=S2WTTMXYcYY 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

13分钟
87
2个月前

EP156:“我不读我发布的代码”:openclaw创始人重塑软件开发的底层逻辑

播客无国界

在 AI 辅助编程普及的今天,许多资深开发者陷入了两种极端的困境:一种是坚守传统的“逐行代码审查”模式,在 AI 生成的海量代码面前感到力不从心,甚至产生抵触情绪,认为 AI 生成的都是“垃圾(Slop)”;另一种则是盲目的“Vibe Coding(凭感觉编程)”,过度依赖 AI 的随机生成,导致代码质量不可控、系统难以维护,最终沦为“调试地狱”。传统的开发流程(PRD -> 编码 -> Code Review -> CI)在 AI 生产力爆发的当下,显得日益臃肿和低效。 【破局与重塑】 本期嘉宾 Peter Steinberger(前 PSPDFKit 创始人,现 OpenClaw 作者)提供了一个颠覆性的视角:“我发布我不读的代码,但这并不疯狂。” 他通过亲身实践,展示了从“手工艺人”到“工业化管理者”的身份转变。核心在于将 AI 视为“不完美但极其高效的实习生”,并将工作的重心从**“编写与阅读代码”转移到了“架构设计与验证闭环”**上。他提出的 Agentic Engineering(代理工程) 理念,强调通过构建能够自我纠错的工具链(CLI、测试、编译反馈),让 AI 自主完成“编码-运行-修复”的循环,从而实现质量的系统性保障。 【核心收获】 听完本期内容,你将掌握: * 思维范式转移:如何克服对 AI 代码的“洁癖”,建立基于“验证”而非“阅读”的信任机制。 * 工程化方法论:什么是“Closing the Loop(闭环原则)”,以及如何为 AI 设计易于调用的 CLI 工具链,而非复杂的 MCP 协议。 * 未来协作模式:为何“Prompt Request(提示词请求)”将取代“Pull Request(拉取请求)”,以及“编织(Weaving)”代码的新工作流。 * 生存指南:在 AI 能够独立完成 80% 工作的时代,高级工程师如何通过提升“系统理解力”和“审美(Taste)”来保持核心竞争力。 3. ### 时点内容 | Key Topics 【底层哲学:Agentic Engineering vs. Vibe Coding】 * 拒绝“凭感觉”:嘉宾强烈反对“Vibe Coding”这一术语,认为它暗示了懒惰和随机。相反,高效的 AI 编程(Agentic Engineering)是高强度的脑力劳动,类似于同时管理 5-10 个实习生并行工作。 * 信任机制重构:不再通过肉眼检查每一行代码的空格和命名来建立信任,而是通过“测试通过率”和“功能验证”来建立信任。 * “人类合并按钮”:资深开发者的角色转变为最终的“合并按钮(Human Merge Button)”,负责把控整体架构和产品体验,而非底层管道(Plumbing)。 【关键技术:Closing the Loop(闭环验证)】 * 自动反馈循环:AI 编程成功的关键在于“闭环”。必须赋予 Agent 运行代码、读取错误日志、并根据错误自我修复的能力。 * CLI 优于 MCP:在工具接口设计上,嘉宾认为简单的命令行工具(CLI)比复杂的 MCP(Model Context Protocol)更具优势,因为 CLI 允许 Agent 通过管道(Pipe)和脚本灵活组合命令,而 MCP 往往限制了上下文的灵活性。 * 自我修复的测试:编写能够自我验证的测试脚本,甚至让 AI 编写测试来验证 AI 编写的代码,形成双重保障。 【实战应用:从文档驱动到原型驱动】 * Prompt Request > Pull Request:在协作中,与其发送一大堆代码变更(PR),不如发送生成这些代码的“提示词(Prompt)”。意图(Intent)比实现细节更重要。 * Weaving(编织)代码:不再是简单的代码合并(Merge),而是让 AI 将新功能“编织”进现有的架构中,保持系统的一致性。 * 全能助手实战:嘉宾构建的 OpenClaw 是一个运行在本地、拥有最高权限的 AI 助手,它通过 CLI 控制家中设备、管理日历、甚至通过 WhatsApp 代理社交,展示了“OS 级 Agent”的雏形。 【趋势洞察:软件工程的终局】 * 团队极简主义:未来一家百亿级估值的公司可能只需要极少数(如 30%)的高效能工程师。 * 技能树重置:对于新人,单纯的代码编写技能贬值,而“系统理解力(System Understanding)”、“好奇心”和“产品嗅觉”成为核心竞争力。 * 代码审查的消亡:传统的人工 Code Review 将逐渐被自动化的“Gate(关卡)”取代,只要代码通过了严格的自动化测试和验证关卡,即可合并。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=8lF7HmQ_RgY 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

104分钟
99+
2个月前

EP155:OpenClaw 创始人专访-AI 智能体正在接管互联网,80% 的 App 将消失

播客无国界

OpenClaw是近期 GitHub 上最火爆的开源项目之一,短短几天内狂揽 16 万 Star。它的核心理念极其简单却具有颠覆性:一个完全运行在你本地电脑上的 AI 智能体,能像幽灵一样控制你的鼠标、键盘、终端,甚至连接你的智能家居和 WhatsApp。 本期节目邀请到了 OpenClaw 的神秘创始人 Peter Steinberger。他曾是一家成功软件公司的创始人,在“退休”后因对 AI 的痴迷而重出江湖。Peter 分享了他如何从一个简单的 WhatsApp 聊天机器人实验,意外发现 AI 惊人的自主解决问题能力(比如自动转码音频并调用 API),从而萌生了打造“通用本地智能体”的想法。 你将听到: * 去中心化 AI 的未来: 为什么 Peter 坚信真正的 AI 革命必须发生在本地设备上,而不是云端? * App 的消亡: 当 AI 可以直接通过 API 或界面操作帮你订餐、健身、记账时,为什么我们还需要成千上万个独立的 App? * Vibe Coding 的极致: 作为一个“退休”老兵,Peter 如何利用多开终端、并行运行多个 Codex 实例,像指挥一支军队一样进行高效开发? * 社区的力量: 为什么他拒绝将 OpenClaw 商业化,而是坚持开源,甚至让社区在 Discord 上与他的私人 Bot 互动? 这是一次关于技术、哲学与未来生活方式的深度对话,无论你是开发者还是 AI 爱好者,都能从中获得关于下一代人机交互的深刻洞察。 时点内容 | Key Topics * OpenClaw 的起源与爆红: Peter 如何在“退休”后因 AI 重燃激情,从一个简单的 CLI 工具演变为轰动全网的开源项目。 * 本地运行的力量: 与云端 AI 不同,OpenClaw 运行在本地,能访问文件系统、控制硬件(如智能家居、音量),拥有无限的潜能。 * “幽灵”般的自主性: 分享了一个令人震惊的案例——AI 自动检测到不支持的音频格式,自主调用 ffmpeg 转码并使用 OpenAI API 翻译,全程无需人类干预。 * App 消亡论: Peter 预测 80% 的 App 将会消失。例如,MyFitnessPal 可以被“拍照发给 AI”取代,AI 会自动记录热量并调整健身计划。 * 多智能体协作: 展望未来,你的私人 AI 可能会直接与餐厅的 AI 谈判订位,甚至在必要时雇佣人类完成线下任务。 * Soul.md 与 AI 人格: Peter 介绍了他如何通过 soul.md 文件赋予 AI 独特的人格和价值观,使其在 Discord 中与其幽默互动,甚至有了“灵魂”。 * 反主流的开发哲学: 为什么 Peter 偏爱 Codex 而非 Claude Code?为什么他坚持使用 CLI 工具而非复杂的 MCP 协议?他展示了如何通过并行运行 10 个终端窗口来极致提升开发效率。 * 开源与商业化: 面对巨大的商业诱惑,Peter 坚持 OpenClaw 应作为开源项目甚至非营利基金会存在,而非另一家 VC 支持的初创公司。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=4uzGDAoNOZc 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

22分钟
99+
2个月前

EP154:如何用 OpenClaw把电脑变成全能管家

播客无国界

本期节目邀请了开源 AI 助手 Clawdbot(现更名为 Openclaw)的作者 Peter Steinberger。他是一位经验丰富的开发者,曾创立并出售过一家成功的软件公司,并在退休后重新被 AI 的潜力点燃激情。 在这场对话中,Peter 分享了他如何从零开始,仅仅为了解决自己在 WhatsApp 上控制电脑的需求,最终打造出一个能够管理日程、订机票、控制智能家居甚至自动修复代码的全能 AI 助手。这不仅是一个关于技术实现的故事,更是一个关于未来生活方式的预言——当 AI 能够直接操作你的电脑和 API 时,我们将不再需要成百上千个独立的 APP,只需和一个“无所不能的朋友”聊天即可解决一切问题。对于所有对 AI Agent、自动化生活以及未来软件交互形态感兴趣的听众来说,这期节目充满了令人兴奋的洞见和实战经验。 时点内容 | Key Topics * 项目的起源: Peter 如何从“退休”状态中复出,最初只是想通过 WhatsApp 远程控制电脑,却意外发现 AI 能够通过分析文件头自动处理语音转文字等复杂任务。 * Clawdbot 的核心理念: 它不仅仅是一个聊天机器人,而是一个拥有电脑完全访问权限的 Agent。它可以读取文件、运行终端命令、调用 API,从而实现真正的自动化。 * 令人惊叹的用例: 自动订票: AI 能够自动登录英国航空网站,找到护照文件并完成值机,甚至通过人机验证。 智能家居控制: 通过逆向工程 API 控制 Eight Sleep 床垫温度,或通过 Philips Hue 控制灯光。 代码自我修复: 接收推特上的 Bug 报告,自动拉取代码库,修复 Bug 并提交,最后回复推特确认修复。 * Vibe Coding vs. Slop: Peter 对当前流行的“Vibe Coding”(氛围编程)持有独特观点。他批评那些只会生成垃圾代码(Slop)的自动化工具,强调“品味”和“人类在环”的重要性。真正的 Vibe Coding 是与 AI 进行深度的交互和迭代,而不是单纯的命令执行。 * APP 的消亡: Peter 预测未来许多 APP(如 MyFitnessPal)将变得多余。因为用户只需给 AI 发一张食物照片,AI 就能自动记录热量并调整健身计划,无需手动输入。 * 多任务并行(AI 工厂): Peter 展示了他如何像玩即时战略游戏一样,同时在多个终端窗口中指挥多个 AI Agent 并行工作,极大地提高了开发效率。 * 开源与社区: 作为一个开源项目,Clawdbot 吸引了大量非技术用户的关注,同时也面临着安全性和维护的挑战。Peter 呼吁更多开发者加入维护,让这个项目超越个人,成为一种公共资源。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=AcwK1Uuwc0U 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

36分钟
99+
2个月前

EP153:为何 OpenClaw 能在几周内“摧毁”传统 Agent 创业赛道

播客无国界

在 AI Agent 爆发的早期,开发者面临着“割裂”的局面:一方面是昂贵且封闭的企业级 Agent SaaS 服务,另一方面是缺乏统一标准、配置繁琐的本地模型。更致命的是,随着 Agent 数量的增加,如何管理成百上千个“智能体员工”、如何赋予它们安全的权限(而不泄露 API Key)、以及如何让它们从单纯的“代码工具”进化为“生活助理”,成为了行业未被满足的空白。 【解决方案】 本期视频带我们走进旧金山 ClawCon 的现场,揭示了 OpenClaw社区如何通过“Vibe Coding(氛围驱动编程)”和极致的开源精神打破这一僵局。视频不仅展示了 OpenClaw Studio 这样的可视化管理工具,解决了 CLI 难以管理大规模 Agent 的痛点;还介绍了 Hilos.ai 等新兴安全层,提出了“无需让 Agent 触碰密钥”的鉴权架构。更重要的是,它展示了一种从“工具使用者”到“生态构建者”的思维跃迁——开发者不再是被动等待 OpenAI 发布功能,而是主动构建自己的“Agent 操作系统”。 【核心收获】 透过 Swyx (Latent Space) 和 Peter Steinberger (The Clawfather) 等人的视角,你将理解: 1. 开源生态的降维打击:为何一个“好玩”的开源项目能比融资数亿的 VC 项目跑得更快。 2. Agentic Infrastructure(代理基础设施)的雏形:从一键部署(Render/Digital Ocean)到多 Agent 编排(Mission Control),基础设施正在如何适应“硅基员工”。 3. 打破“容器”效应:Coding Agent 如何突破编程领域,开始接管法律、日程管理甚至物理世界(Robotics)的复杂任务。 3. ### 时点内容 | Key Topics 【趋势洞察】 * Stripper Pole Growth(垂直增长):OpenClaw 项目的 GitHub Star 数呈垂直上升趋势,标志着 AI 社区从“模型崇拜”转向“应用落地”的狂热。 * 开源 vs. VC:Swyx 指出 OpenClaw 对传统 Agent 创业公司构成了毁灭性打击。因为 Peter 将“有趣(Fun)”作为核心驱动力,构建了真实的社区,而大多数 VC 项目只是在假装相信 Agent。 * Breaking Containment(打破遏制):原本为编程设计的 Coding Agent(如 Claude Code),正在溢出到非编程领域(生活助理、法律文书、家庭自动化),这预示着通用 Agent 时代的提前到来。 【技术生态与架构】 * OpenClaw Studio:由社区开发者 George Pickett 构建的可视化界面(UI),旨在解决 CLI 无法管理“Agent Fleet(代理舰队)”的问题。它提出了“统一收件箱(Unified Inbox)”的概念,让人类只需负责审批(Approve/Reject),而让 Agent 自主领取和执行任务。 * 一键部署基础设施:Render 和 Digital Ocean 现场演示了如何在 4 分钟内通过简单的 URL 或 Marketplace 部署属于自己的 OpenClaw 实例,大幅降低了普通用户的门槛。 * 安全架构重塑:Hilos.ai 提出了“MCP Butter Knife”概念,通过专有技术让 Agent 拥有钱包和权限边界,但无需直接接触 API Key,解决了 Agent 自主行动时的信任与责任溯源问题。 * Google/VirusTotal 合作:Peter 透露与 Google 达成合作,通过 VirusTotal 对所有上传的 OpenClaw Skill 进行安全扫描,试图将这个“黑客玩具”转化为普通用户可信赖的消费级产品。 【物理与多模态融合】 * 实体化 Agent (PlayPin):展示了基于 ESP32 的小型机器人(类似甲壳虫/宠物),它们不仅是玩具,更是 OpenClaw 的物理载体,通过意图识别(Intent Recognition)在物理世界中执行指令。 * Twitch Stream Bot:一个基于视觉模型(Vision Model)的直播机器人,能够每 5 秒截取一次直播画面并结合音频(Whisper),实时以“观众”的身份在聊天室吐槽互动,展示了极低成本的多模态闭环。 【底层哲学】 * Vibe Coding(氛围编程):这不是贬义词,而是一种新的开发范式——在 AI 能够解决 80% 技术细节的当下,开发者的核心竞争力变成了“品味(Taste)”、“创意”和“社区号召力”。 * 灵魂(Soul)与个性:OpenClaw 引入了 soul.md 和心跳机制(Heartbeat),让 Agent 不再是冷冰冰的问答机器,而是具有长期记忆、主动性和独特人格的数字伴侣。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=jMnLqGU-Ds4 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

132分钟
99+
2个月前

EP152:Clawdbot 作者首度露面:我是如何“退休”后因 AI 再次上瘾的

播客无国界

Clawdbot(现因 Anthropic 要求改名为 Maltbot,最新又改名为Openclaw)无疑是过去一周 AI 圈最火爆的项目,其 GitHub Star 增长曲线甚至被形容为“垂直向上的直线”。在这个独家专访中,项目背后的神秘开发者 Peter Steinberger 首次公开露面,分享了他从一家成功软件公司的创始人“退休”,到因沉迷 AI 而重出江湖的传奇故事。 这不仅是一个关于技术的故事,更是一个关于“纯粹热爱”的故事。Peter 坦言自己不需要钱,也没有融资计划,甚至希望项目成为非营利基金会。他揭示了 Vibe Coding(直觉编码)的本质——“为模型而写代码”,以及为什么 CLI(命令行界面)比 GUI(图形界面)更具扩展性。如果你想了解那个让无数人买 Mac Mini 来跑本地 Agent 的幕后推手,以及他对 AI 个人助理未来的独到见解,这期节目绝对不容错过。 时点内容 | Key Topics * 退休后的“复吸”: Peter 曾经营一家成功的软件公司 13 年,出售后经历了一段“烧尽”的时期。直到 2026 年初遇到 Claude Code,他重新找回了编程的激情,甚至到了“无法入睡”的地步。 * 从 WhatsApp 到全能助理: 项目的起源仅仅是因为 Peter 想在 WhatsApp 上与他的电脑聊天。但他发现 AI 极其聪明——当他发了一条语音消息但不支持时,AI 居然自己调用 ffmpeg 转码并用 OpenAI API 翻译成文字。 * Vibe Coding 的哲学: Peter 认为现在的编程不仅仅是拼凑代码(Glue),更是一门艺术。秘诀在于“不要为人类构建工具,要为模型构建工具”——比如让 CLI 的帮助文档尽可能符合 Agent 的思维逻辑。 * 改名风波与“Maltbot”: 讲述了收到 Anthropic 改名要求的幕后故事。他在 20 分钟内一边在 Twitter 上重命名,一边防止加密货币骗子抢注,过程惊心动魄。 * Mac Mini 的意外爆红: 并不是每个人都需要 Mac Mini,但 Peter 的项目意外引发了 Mac Mini 的抢购潮。他解释了本地运行 Agent 的优势:绕过企业红带(Red Tape),直接操作数据。 * 拒绝商业化: 面对无数 VC 的疯狂追逐,Peter 表示他对成立公司没兴趣,更倾向于将项目做成基金会或非营利组织,让代码成为公共产品。 * 安全性与开源困境: 坦诚目前项目还存在 Prompt Injection 等安全风险,且因用户将其部署在公网而面临巨大挑战。他呼吁更多维护者加入,帮助处理海量的安全报告。 * App 的消亡: 预测未来许多 App(如 MyFitnessPal)将消失,因为用户只需拍照发给 Agent,Agent 就能根据上下文自动处理一切,App 将退化为纯 API。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=qyjTpzIAEkA 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

30分钟
99+
2个月前

EP151:40 分钟精通 Google AI Studio-从“Yap to App”语音编程到 3D 户型图生成

播客无国界

这不仅是一场工具演示,更是一次通过 Google 产品负责人 Logan Kilpatrick 的视角,窥探 Google 内部开发文化转型的机会。本期节目中,Logan 现场演示了如何使用 Google AI Studio 和 Gemini 3 进行“Vibe Coding”(氛围/直觉编程),在几分钟内从零构建社交媒体生成器、交互式流体模拟,甚至直接通过截图“克隆”并修改 AI Studio 自身的 UI。 对于产品经理和开发者来说,这期内容极具启发性:它展示了未来的产品开发流程是如何从“写文档(PRD)”转变为“做原型”的。Logan 详细分享了 Google 如何利用 AI Studio 来构建 AI Studio,以及为什么“Shipping Fast”(极速发布)已成为他们唯一的生存模式。此外,他还透露了 Google 招聘产品人才的新标准——比起光鲜的简历,他们更看重“公开构建”(Build in Public)和高质量的“摩擦日志”(Friction Logs)。 时点内容 | Key Topics * Vibe Coding 实战演示: 从截图到代码: 演示仅用一张截图,在 68 秒内克隆出功能完整的 AI Studio UI,并直接在生成的界面上进行功能迭代。 Yap to App(语音编程): 展示如何通过语音对话(而非打字)快速调整 UI 布局和功能,例如“给我做 5 个不同的设计风格并加一个切换按钮”。 交互式应用生成: 现场构建一个交互式户型图应用,能识别上传的 2D 户型图并将其转化为 3D 漫游或重绘风格。 * Google 的文化转型: 唯快不破: Logan 直言 Google 现在的模式只有一种,那就是“Ship Fast”。团队不再进行长周期的规划,而是通过快速原型验证想法。 PRD 的消亡: 在 Google 内部,传统的长篇产品需求文档(PRD)正在被“功能性原型”取代。现在提需求,必须带上一个能跑的 Demo。 吃自己的狗粮: AI Studio 团队每天都在用 AI Studio 来开发 AI Studio,通过高强度的内部使用来发现痛点。 * Gemini 3 的多模态能力: UI 注释修复: 利用 Gemini 3 强大的视觉理解能力,只需在界面截图上画圈并写下“我不喜欢这个,把它折叠起来”,AI 就能理解意图并修改代码。 内置 Google 服务: AI Studio 原生集成了 Google Search 和 Google Maps,开发者无需配置 API Key 即可直接调用实时地图数据(例如:构建一个查找附近饺子馆的 Chatbot)。 * 招聘与人才观: 公开构建(Build in Public): Logan 坦言,在评估候选人时,他在 Twitter/X 上看到的公开项目和构建过程,比简历更具说服力。 摩擦日志(Friction Logging): 想要加入 Google 产品团队?最好的敲门砖是写一份详尽的“摩擦日志”,清晰地指出产品的问题以及你认为应该如何改进。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=lbESr58-7DQ 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

40分钟
78
2个月前

EP150:DeepMind CEO 达沃斯重磅访谈-Gemini 3/机器人与 100 倍于工业革命的未来

播客无国界

在 2026 年的达沃斯论坛上,Google DeepMind 首席执行官 Demis Hassabis 接受了 Bloomberg 的深度专访。这不仅是一次关于 Google 最新模型 Gemini 3 的技术发布展示,更是一场关于人类文明未来的哲学思辨。 Hassabis 在访谈中展现了极强的信心,认为 Google 已经找回了状态(Got its mojo back),并正在通过与波士顿动力(Boston Dynamics)的合作,将 AI 的能力从数字世界延伸至物理世界。最令人深思的是,他对于 AGI(通用人工智能)带来的终极挑战的看法:我们可能不再需要担心就业或经济(因为将进入后稀缺时代),而是要担心当工作不再必须时,人类该如何寻找存在的“意义”。对于关心 AI 终局、机器人技术以及未来十年社会形态的听众,这是一期必听的指南。 时点内容 | Key Topics * Google 的反击与 Gemini 3: Hassabis 确认 Google 已凭借 Gemini 3 重回 SOTA(最先进)地位,并指出 Google 是唯一拥有从芯片(TPU)、数据中心到前沿模型和数十亿用户产品全栈优势的公司。 * 机器人的“AlphaFold 时刻”: 预测物理智能(Physical Intelligence)将在未来 18-24 个月内迎来突破。DeepMind 正在将 Gemini 的多模态能力赋予波士顿动力的机器人,使其能真正理解和操作物理世界。 * 关于 DeepSeek 与中国竞争: 认为西方对 DeepSeek 的反应是“过度恐慌”。虽然承认字节跳动等中国公司紧跟前沿(仅落后 6 个月),但他指出中国尚未证明其具有突破前沿(Innovate beyond the frontier)的能力。 * AGI 时间表与定义: 坚持预测 2030 年有 50% 的概率实现 AGI。他定义的 AGI 门槛极高,不仅要解决问题,还要能像顶尖科学家一样“提出问题”并具备持续学习的能力。 * 100 倍于工业革命: 这是一个比工业革命规模大 10 倍、速度快 10 倍的变革(即 100x 效应)。 * 后稀缺时代的“意义危机”: 相比于经济分配问题,Hassabis 更担心在能源和物质极度丰富的“后稀缺时代”,人类将面临关于“目的”和“意义”的哲学危机。 * 给未来的建议: 对于年轻人,最重要的技能是“学会学习”(Learning to learn);对于企业,选择价值观一致的 AI 合作伙伴至关重要。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=BbIaYFHxW3Y 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

26分钟
99+
2个月前

EP149:Meta 产品经理亲授:零代码基础如何用 Cursor 和 Claude 构建复杂应用

播客无国界

你是否认为不懂代码就无法构建真正的软件产品?本期节目彻底打破了这一刻板印象。Lenny 邀请到了 Meta 的产品经理 Zevi Arnovitz,他没有任何技术背景,却利用业余时间构建了复杂的商业化应用。 Zevi 分享的不仅仅是“如何写 Prompt”,而是一套完整的AI 工程化工作流。他展示了如何超越简单的代码生成工具(如 Bolt 或 Lovable),利用 Cursor 和 Claude Code 像真正的 CTO 一样思考和构建系统。 本期最精彩的部分在于他发明的**“Peer Review”(同行评审)工作流**——让 Claude 扮演善于沟通的技术主管,让 GPT 扮演沉默寡言但技术高超的“黑客”,让 Gemini 扮演极具创意但偶尔疯狂的“设计师”,三个模型互相审查代码、争论并修复 Bug。无论你是想构建独立产品的非技术人员,还是希望利用 AI 提升效率的 PM,这期节目提供的实战框架(从创建 Linear 工单到更新文档闭环)都将是你的终极指南。 时点内容 | Key Topics * 非技术人员的觉醒: Zevi 如何在看到 Sonnet 3.5 发布后,从一个完全不懂代码的 PM 变成狂热的建设者。 * 工具进阶之路: 为什么 Bolt 和 Lovable 等一体化工具适合起步,但构建复杂应用时必须升级到 Cursor + Claude Code? * 核心工作流拆解: Create Issue: 使用语音和 AI 快速将想法转化为结构化的 Linear 工单。 Exploration Phase: 与 AI(扮演 CTO 角色)进行深度对话,明确技术方案而非直接开始写代码。 Create Plan: 生成详细的 Markdown 开发计划,将任务拆解为前端(Gemini 擅长)和后端(Claude 擅长)任务。 Execute: 利用 Cursor Composer 极速执行代码。 * 天才般的“多模型 Peer Review”: 如何让不同的 AI 模型(Claude, GPT, Gemini)扮演不同性格的工程师互相审查代码,从而发现单模型无法发现的盲点。 * 文档闭环(The Documentation Loop): 遇到错误时,不仅修复代码,还要求 AI 反思“为什么错了”,并更新系统 Prompt 和文档,防止错误再次发生。 * 失败角落: 分享他在 Wix 早期试图证明自己是“10x PM”却惨遭失败的经历,以及如何转变为“10x Learner”(十倍速学习者)。 * AI 辅助面试: 如何用 AI 进行高强度的模拟面试,甚至让 AI 扮演面试官给出无情的反馈。 * 给年轻人的建议: 为什么现在是历史上成为“初级工程师”或创业者的最佳时机?AI 让经验的壁垒崩塌,好奇心和学习能力成为新的核心竞争力。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=1em64iUFt3U 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

72分钟
99+
2个月前

EP147:Clawdbot(Moltbot)、Conductor 与 Agentic Coding 的新基础设施

播客无国界

如果您最近在 AI Twitter 上看到 "Ralph Wiggum"、"Clawdbot" 或 "Mac Mini" 等词汇感到一头雾水,那么本期节目就是您的最佳补课指南。进入 2026 年,"Vibe Coding"(氛围编码/直觉编码)已经从单点辅助进化为了一种全新的自动化生产力范式。 本期《AI Daily Brief》深度梳理了过去几周震撼技术界的几个关键事件:从 Cursor 团队如何利用数百个 Agent 并发工作,在一周内从零构建出一个包含 300 万行代码的浏览器;到开发者们如何利用 "Ralph Wiggum Loop" 和本地运行的 Clawdbot,打造出能够在自己睡觉时自动修 Bug、回邮件甚至自我进化的“数字员工”。如果您想知道 2026 年的专业开发者是如何利用 Opus 4.5 和 Claude Code 彻底解放双手的,这期节目将带您一窥最前沿的 Agentic Coding 生态。 时点内容 | Key Topics * Cursor 的疯狂实验: Cursor CEO 展示了他们如何利用 GPT 5.2 和数百个并发 Agent,在短短一周内编写了一个拥有 300 万行代码、基于 Rust 引擎的全新 Web 浏览器。 * 多智能体协作的进化: 揭秘 Cursor 在实现大规模 Agent 协作时的失败尝试(扁平结构导致的死锁、读写分离导致的风险厌恶),以及最终成功的解决方案——Planner(规划者)与 Worker(执行者) 的流水线模式。 * Ralph Wiggum Loop: 这个听起来滑稽的名字实际上是 2026 年最高效的编码工作流。它本质上是一个自动化的 Bash 循环,让 Agent 能够根据详细的 PRD 和原子化的用户故事(User Stories),在你睡觉时不知疲倦地通过“执行-测试-修复”的闭环完成任务。 * Claudebot 与 Mac Mini 现象: 介绍运行在本地硬件(如闲置的 Mac Mini)上的开源 Agent —— Clawdbot。它可以通过 WhatsApp 或 Telegram 控制,能够访问终端、管理日历甚至自我编写插件,被许多开发者视为“第一位数字员工”。 * Nat Friedman 的用例: Nat 分享了他的 Clawdbot 如何全天候监控应用错误,自动修复 Bug 并提交 PR,甚至处理客户投诉并生成每日晨报。 * Conductor 的崛起与 GUI 复兴: 尽管极客们热爱终端(CLI),但像 Conductor 这样的图形化界面工具正在成为新宠。Notion 的 Brian Leven 等大咖透露,他们现在花费大量时间在 Conductor 中,认为纯 CLI 已是“石器时代”。 * 从辅助到自主: 2026 年 Vibe Coding 的核心趋势总结——从作为瓶颈的人类指挥官,转变为管理一支在后台持续工作的全自动 Agent 军队。 相关链接与资源: [视频来源]https://www.youtube.com/watch?v=wWpjf_aShHE 本播客采用虚拟主持人进行播客翻译的音频制作,因此有可能会有一些地方听起来比较奇怪。如想了解更多信息,请关注微信公众号“心流赫兹”获取AI最新资讯。

20分钟
99+
2个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧