节目列表: 跨国串门儿计划 - EarsOnMe

跨国串门儿计划

📝 本期播客简介本期我们克隆了知名开发者 Matt Pocock 在 AI Engineer 大会上的深度工作坊。Full Walkthrough: Workflow for AI Coding from Planning to Production — Matt Pocock (@mattpocockuk ) Matt 是 TypeScript 专家、在线教育平台 AI Hero 的创始人，过去半年他全身心探索如何将软件工程的基本功与 AI 工具高效结合。在这期播客中，你将听到 Matt 如何通过严谨的软件工程实践，让 AI 编程不再是“氛围编程”，而是可控制、可预测、高质量的工程流程。从理解大语言模型的局限性，到运用“追问”技巧对齐需求，再到将任务拆分、测试驱动开发、代码审查，Matt 提供了一套完整的工作流，帮助你真正驾驭 AI，而不是被 AI 驾驭。 👨‍🏫 本期嘉宾 Matt Pocock，TypeScript 专家，在线教育与开发工具 AI Hero 创始人。他以深刻的软件架构理解和丰富的 TypeScript 教学经验闻名，长期致力于帮助开发者提升代码质量与工程效率。 ⏱️ 时间戳开场 & 播客简介 00:00 主播一恺介绍节目与本期克隆的AI编程工作坊 00:37 Matt Pocock与原话亮点：软件工程基本功与AI的化学反应软件工程基本功：AI时代的基石 01:31 Matt开场：AI是新范式，但软件工程基本功同样关键 02:41 现场调查：多数开发者每天用AI编程，但也常被AI气疯大语言模型的“阿喀琉斯之踵” 03:57 聪明区与蠢笨区：为什么上下文越长AI越蠢？ 06:33 多阶段计划：如何拆分大任务避开蠢笨区 07:54 记忆碎片：LLM的遗忘特性与上下文重置 09:20 压缩 vs 清空：哪种上下文管理方式更好？规划与对齐：让AI听懂你的想法 11:58 练习项目：为课程平台添加游戏化功能 12:29 “追问我”技巧：远离“规格直接转代码”的误区 14:55 实战grill me技能：与AI进行深度盘问，达成共同理解 18:20 子代理的作用：隔离上下文，降低主窗口压力 21:31 问答环节：如何将追问技巧融入团队协作从想法到产品需求文档（PRD） 26:48 盘问结束后，为什么需要一份PRD来记录设计概念？ 28:09 自动生成PRD：用户故事、实现决策与模块划分 31:34 为什么不读PRD？信任对齐过程，把时间花在QA上任务拆分：看板、垂直切片与并行开发 34:28 看板方法：将PRD拆成独立任务，理清阻塞关系 36:38 垂直切片与曳光弹开发：避免AI“水平编码”，尽早获得反馈 43:38 创建任务依赖图，规划多智能体并行执行实现阶段：自动智能体与测试驱动开发 45:45 白班与夜班：人类完成规划，AI火力全开自动实现 46:54 Ralph全自动智能体循环：任务优先级与反馈回路 50:31 问答：如何管理AI产出的大量代码审查？ 56:50 AI对AI的QA：让AI自审代码，但记得清空上下文 58:15 测试驱动开发（TDD）：从AI身上榨取最大价值的关键代码审查、规范与架构优化 01:00:32 人工QA：重新注入人的品味，避免产出“渣滓” 01:04:18 浅模块 vs 深模块：好代码库让AI更聪明 01:09:53 改善代码库架构技能：扫描耦合，创建可测试的深模块 01:11:47 文档腐烂：为什么PRD完成就应丢掉？ 01:15:42 编码规范策略：对实现者“拉取”，对审查者“推送” 01:17:15 Sandcastle：跨智能体并行开发的TypeScript框架总结与建议 01:20:41 完整工作流回顾：想法→对齐→PRD→看板→实现→审查 01:22:19 核心建议：多读经典软件工程书籍，它是一座纯金矿 🌟 精彩内容 💡 软件工程基本功是AI时代的放大器 Matt强调，AI是新范式，但模块化、测试、代码审查这些基本功在与AI协作时更为重要。糟糕的代码库造出糟糕的智能体，优秀的架构才能让AI发挥威力。 💡 聪明区与蠢笨区：LLM的核心约束理解大语言模型的“注意力衰减”是高效使用AI编程的前提。上下文超过一定长度后，模型性能急剧下降，因此必须将任务拆小，避免一脚踩进蠢笨区。 💡 “追问我”技巧：与AI深度对齐的秘密武器 Matt独创的“grill me”技能，通过不断向开发者提问的方式，强迫AI与人在设计概念上达成一致。这远比直接产出计划文档更能确保后续实现不跑偏。 💡 TDD：让AI写出高质量代码的钥匙测试驱动开发（红-绿-重构）是让AI编程产生价值的绝对关键。它提供了即时反馈循环，避免AI盲目编码，并显著提升代码库的测试覆盖率。 💡 垂直切片与深模块：设计AI友好的系统 AI倾向于一层一层水平编码，导致迟迟无法集成测试。采用垂直切片（曳光弹）和深模块设计，能让人和AI在开发早期就获得完整反馈，大幅提升效率。 💡 人机协作的终极工作流 Matt分享了一套完整打法：人工负责规划和需求对齐，生成PRD与看板任务；然后交给AI自动实现；最后人工进行QA和审查。这套流程将AI的效率与人的品味完美结合。 🌐 播客信息补充翻译克隆自：本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

83分钟

3k+

2个月前

#509.前字节研究员深度访谈：中国AI的真实差距、刷榜文化与Agent新赛道

跨国串门儿计划

📝 本期播客简介本期我们克隆了播客《Into Asia》的一期深度对谈A Year Inside ByteDance's AI Lab 【编者述：该内容存在争议，x 上有评论认为该研究者并未接触到字节AI 的核心项目，仅作为信息和视角补充】主持人 Cheche 与北京大学助理教授、前字节跳动研究员 Chu Chu 坦诚交流了中国人工智能领域的竞争与挑战。Chu Chu 曾深度参与大语言模型的研发，对中美 AI 差距有着一线观察。在节目里，他揭示了中国 AI 公司内部刷榜文化的真相，分析了芯片禁令下数据蒸馏的无奈，并尖锐指出中美 AI 差距其实正在拉大。从字节跳动的 IMO 数学竞赛项目，到北大推理效率算法的新方向，再到具身智能与 AI Agent 的中国机会，这场对话带来了一位圈内人最真实的反思与预判。 👨‍🔬 本期嘉宾 Chu Chu，北京大学助理教授，前字节跳动 Seed 部门研究员，加州大学洛杉矶分校（UCLA）博士。他曾先后在北京通用人工智能研究院（通院）和字节跳动工作，亲历了中国大语言模型从追赶 GPT-4o 到被 DeepSeek 冲击的全过程，目前专注于 AI 推理效率与具身智能的研究。 ⏱️ 时间戳 00:00 开场 & 节目简介嘉宾背景与 AI 之路 01:33 从吴恩达课程到 UCLA 博士 03:10 跟随朱松纯归国：数据驱动与规模假设的争论 04:12 在通院的日子：ChatGPT 如何改变 AI 研究格局 05:51 加入字节跳动：SEED 的诞生与 DeepSeek 的震撼字节的 AI 战场：刷榜、资源与隐形压力 07:23 “我们以为追上了 GPT-4o，直到 DeepSeek 出现” 08:07 形式化数学与 IMO 金牌项目：公关还是科研？ 09:35 SEED 内部结构：LLM、VLM 与数学组的分工 11:04 刷榜文化：基准分数如何定义你的成败 12:35 午休两小时、九小时工作制：字节 AI 研究员的一天 14:11 从银牌到交付：当研究兴趣被工程琐事消磨 17:16 谷歌三个月迭代一轮，我们要半年：速度差距的背后 18:16 特供版 H20、禁运前抢购的 H100：字节的芯片家底 19:43 国产芯片为什么训练用不上？ 21:14 追赶者缺乏创新：中美差距真的在缩小吗？差距拉大的本质：蒸馏、数据与基础设施 21:57 Claude Code 让我不想再招博士生：编程智能体的震撼 22:48 用户反馈循环：美国模型的真正护城河 24:25 离开字节的原因：大厂 LLM 工程其实很无聊 26:04 北大新方向：推理效率提升 5%，就能省下天量成本 27:50 捷径的代价：中国公司为何沉迷数据蒸馏？ 29:01 什么是蒸馏？用 GPT 的答案训练自己的模型 30:06 AGI 信仰与现实：智能体如何重构工程师的角色具身智能与下一代 Agent 31:16 制造业优势：中国可能在具身智能赛道领先 32:20 宇树机器人擅舞却不擅“思”：运动控制与智能操作的鸿沟 33:31 如何让机器拥有灵巧操作的能力？ 34:12 Open Claw 与 Vibe Research：当研究生开始让智能体帮自己盯实验 35:23 智能体的隐私陷阱与使用边界 36:17 中国程序员正在用 Claude Code 写中国的大语言模型？ 37:05 结语 🌟 精彩内容 💡 中美 AI 差距反而在拉大？ Chu Chu 坦言，尽管在部分基准上中国模型看似追平，但实际体验和智能涌现上的差距仍在扩大。核心原因是用户反馈循环的断裂和基础设施的全面落后。“我认为我们还远远落后，而且差距还在越拉越大，这真的很让人难过。” 💡 刷榜文化才是真正的压力在字节等大厂，每个团队紧盯着自己负责的基准分数，却没有将表现转化为真实场景中的好用体验。“从论文上看，中国的每一家大厂都有一个不错的模型，但以我自己的使用体验来说，我并不觉得它们真的够好。” 💡 蒸馏：被卡住脖子的中国 AI 在走捷径为快速获取高质量训练数据，不少中国公司直接查询 GPT、Claude 等模型，将答案塞进自己的训练集。这种蒸馏虽然省时省钱，却让企业迟迟建不起自主的数据管道，形成恶性循环。 💡 推理成本才是烧钱大户训练模型的成本固然高昂，但 Chu Chu 指出，真正吃掉利润的是部署后的推理算力。“如果能从算法上让推理效率提高一点点，哪怕百分之五，给公司省下的钱也会非常可观。” 这也是他回归北大后的主攻方向。 💡 具身智能：中国的下一张王牌凭借全球领先的硬件制造能力，尤其在电机和本体方面，中国在具身机器人领域优势明显。但如何让宇树这样的机器人拥有真正的大脑——灵巧地拿起杯子、走进千家万户——仍是待解难题。 💡 智能体正在承包科研工作他的学生已经开始用 Open Claw 监控模型训练、自动调试 Bug，团队甚至提出“Vibe Research”的概念：设定一个监控任务，就让智能体去完成，自己直接去睡觉。 🌐 播客信息补充翻译克隆自：本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

37分钟

4k+

2个月前

#519.普林斯顿Zhuang Liu谈架构、数据与记忆的真相

#518. AI时代的超级个体：Notion产品负责人谈主动性、品味与可塑软件

#519.巴菲特首次台下对话：恐慌时买入、黄金法则与美国的秘密配

#517. 解码Snap的未来：Evan Spiegel详解AR眼镜、AI写代码与社交网络新范式

#516. Andrej Karpathy 对谈：为什么程序员从未如此落后？

#515. GPT-5、Claude 和 Gemini 的是如何训练与部署的

#514.DeepMind创始人Demis Hassabis谈AGI、AlphaFold与科学发现的未来

#513.纳瓦尔谈 Vibe Coding

#512.十亿月活背后的创新与焦虑：Snap CEO Evan Spiegel谈分发护城河、AR野心与组织革命

#511.小米的野望：小米CFO详解AI与全球化战略

#510.AI Coding For Real Engineers：软件工程基本功如何让AI编程事半功倍

#509.前字节研究员深度访谈：中国AI的真实差距、刷榜文化与Agent新赛道

加入我们的 Discord

扫描微信二维码

播放列表

跨国串门儿计划 - 节目列表

#519.普林斯顿Zhuang Liu谈架构、数据与记忆的真相

#518. AI时代的超级个体：Notion产品负责人谈主动性、品味与可塑软件

#519.巴菲特首次台下对话：恐慌时买入、黄金法则与美国的秘密配

#517. 解码Snap的未来：Evan Spiegel详解AR眼镜、AI写代码与社交网络新范式

#516. Andrej Karpathy 对谈：为什么程序员从未如此落后？

#515. GPT-5、Claude 和 Gemini 的是如何训练与部署的

#514.DeepMind创始人Demis Hassabis谈AGI、AlphaFold与科学发现的未来

#513.纳瓦尔谈 Vibe Coding

#512.十亿月活背后的创新与焦虑：Snap CEO Evan Spiegel谈分发护城河、AR野心与组织革命

#511.小米的野望：小米CFO详解AI与全球化战略

#510.AI Coding For Real Engineers：软件工程基本功如何让AI编程事半功倍

#509.前字节研究员深度访谈：中国AI的真实差距、刷榜文化与Agent新赛道

加入我们的 Discord

扫描微信二维码

播放列表