节目列表: 跨国串门儿计划 - EarsOnMe

#154. Chip Huyen：AI时代，手动检查数据竟是“性价比之王”？

📝 本期播客简介本期我们克隆了：AI Engineering with Chip Huyen 主持人 Gergely Orosz 邀请到计算机科学家、作家 Chip Huyen。Chip 不仅是 O'Reilly 平台上备受欢迎的《AI Engineering》一书的作者，还曾在 Netflix 从事研究，担任过 Nvidia 生成式 AI 框架 NeMo 的核心开发者，并在斯坦福大学教授机器学习系统设计。在这期节目中，Chip Huyen 与 Gergely Orosz 深入探讨了人工智能工程的核心概念，清晰地剖析了它与传统机器学习工程的区别和演进。您将了解到构建AI应用的典型步骤，从模型选择、热门的检索增强生成（RAG）技术，到何时以及如何进行模型微调。Chip 还分享了软件工程师如何务实地进入AI应用开发领域，评估AI系统输出的常见方法与挑战，以及在AI项目初期应避免的常见误区。此外，她还对AI是否会取代软件工程师等热门话题给出了独到见解。 👨‍⚕️ 本期嘉宾 Chip Huyen，计算机科学家、作家，《AI Engineering》一书的作者。她曾在 Netflix 从事研究，是 Nvidia 生成式AI框架 NeMo 的核心开发者，也曾在 Snorkel AI 担任机器学习工程师，并创办了人工智能初创公司 Claypot AI。她曾在斯坦福大学教授机器学习系统设计课程，是全球人工智能工程领域最具影响力的专家之一。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:00 开场白与本期内容概览 AI 工程的定义与嘉宾介绍 00:02:08 AI 工程与传统机器学习工程的区别初探 00:02:49 嘉宾 Chip Huyen 背景介绍 Chip Huyen 的著作《AI Engineering》 00:04:07 书籍的广度与深度及著书心得 00:05:13 著书过程中的大量研究与“体力活” 在快速发展的 AI 领域著书立说 00:07:11 关注基本原理，预判技术趋势 (如RAG、提示工程、上下文长度、多模态) 00:09:36 对提示工程和上下文长度趋势的预判深入探讨 AI 工程 00:11:11 AI 工程与机器学习工程的差异详解 00:13:23 AI 工程流程：从产品到数据到模型，更侧重产品与工程构建 AI 应用的核心技术与步骤 00:16:06 AI 系统中传统机器学习组件的重要性 (如路由、分类器) 00:17:47 构建AI应用的常用技术概览 00:18:21 从理解用户需求、制定评估标准到提示工程 00:20:00 RAG 技术详解：不止于向量搜索，传统检索与数据准备的重要性 00:21:50 数据准备的重要性与简单方法的优先 00:24:20 微调的考量与挑战：高成本、维护难度、可能被快速迭代的新模型超越 AI 解决方案的务实方法 00:26:16 结构化方法与渐进式部署，优先开拓新用例 00:27:34 案例：客户服务自动化的典型步骤 (公开渠道、路由优化、人机协作) 00:31:12 避免“万能锤”思维，专注解决实际问题，理解问题本质应对 AI 浪潮中的 FOMO (错失恐惧症) 00:32:21 科技公司的 FOMO 现象及其正面意义 00:33:15 保持冷静，专注解决核心问题，避免追逐新闻表面评估 AI 系统的挑战与方法 00:34:41 AI 越智能，评估越困难，人类评估面临瓶颈 00:36:47 评估方法：功能正确性 (如编码)、AI 即评委、比较评估 00:39:29 评估工具的局限性与用户理解的重要性 (案例：会议总结、税务软件) 00:42:01 手动检查数据的价值与持续的人工评估 AI 应用开发中的常见误区 00:44:15 误区一：在不需要时使用生成式 AI (案例：用电优化) 00:45:36 误区二：因简单问题或产品设计不佳而过早放弃 (案例：简历提取) 00:47:12 误区三：初期过度复杂化或滥用抽象层次过高、不成熟的新框架软件工程师学习 AI 的方法 00:50:48 项目驱动学习与结构化学习的结合 00:52:07 教程学习的风险与提问、深入理解的重要性 (案例：import ibis) 00:54:08 观察自身工作，寻找 AI 应用点，解决个人痛点 AI 对软件工程未来的影响 00:55:27 AI 辅助编码，而非取代问题解决与工程设计 00:58:21 AI 可能助力构建更复杂的软件系统，提升工程师的生产力 AI 的未来应用前景展望 00:59:33 教育领域：培养提问能力，高效学习 00:59:50 娱乐领域：创作更具智力启发性的内容，媒介改编 01:01:33 企业组织结构的变革潜力 (如信息聚合对中层管理的影响) 快问快答与总结 01:02:06 常用编程语言 (Python, JavaScript) 与喜爱的 LLM (视用途而定) 01:03:30 自用 AI 工具 (论文研究助手) 与书籍推荐 (《复杂适应系统》、《自私的基因》、《反脆弱》) 01:05:45 总结与感谢，欢迎反馈 🌟 精彩内容 AI工程新范式: Chip Huyen 阐释了AI工程如何从传统机器学习工程演变而来，强调了从“产品到数据到模型”的流程转变，以及对工程和产品思维的侧重。构建AI应用的实用路径: 详细拆解了从理解用户需求、提示工程、RAG（检索增强生成）技术的正确应用（强调数据准备和简单检索方法的重要性），到谨慎考虑模型微调的完整开发流程。 AI系统评估的深层挑战: 探讨了AI系统评估的复杂性，介绍了功能正确性、AI即评委、比较评估等方法，并强调了理解用户真实需求和持续人工审查的重要性。避开常见陷阱: 指出了团队在构建AI应用时易犯的错误，如在不必要时使用AI、因初级问题过早放弃、初期过度复杂化以及盲目采用不成熟的框架。工程师的AI学习之道: 提供了软件工程师学习AI的建议，倡导项目驱动与结构化学习相结合，鼓励批判性思维，并从自身工作流程中发掘AI应用点。 AI与软件工程的未来: Chip Huyen认为AI将增强而非取代软件工程师，自动化编码的物理行为，使工程师能专注于更复杂的问题解决和系统设计，推动软件向更高复杂度发展。 AI应用前景展望: 分享了对AI在教育（提升学习效率和提问能力）、娱乐（创造有深度的互动内容）以及企业（重塑组织结构，如信息聚合对中层管理的影响）等领域的积极展望。 🌐 播客信息补充翻译克隆自：AI Engineering with Chip Huyen 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

67分钟

#153. 人工智能教父Geoffrey Hinton：AI的真实风险与人类的未来

📝 本期播客简介本期我们克隆了全球顶尖商业及励志播客之一《The Diary of a CEO》。主持人 Steven Bartlett 深度对话了被誉为“人工智能教父”的杰弗里·辛顿（Geoffrey Hinton）博士。辛顿博士，这位图灵奖得主，是深度学习领域的奠基人之一，他的工作塑造了我们今天所认知的人工智能。然而，在为AI奉献了半个世纪之后，他为何选择离开谷歌，并转而向世界发出关于AI潜在风险的严峻警告？节目中，辛顿博士将坦诚分享他对AI未来发展的忧虑，包括超级智能可能带来的生存威胁、AI技术滥用（如网络攻击、自主武器、选举操纵），以及对就业市场的颠覆性冲击——他甚至一度建议人们去接受培训当水管工。这不仅是一场关于AI技术利弊的深刻探讨，更是对人类未来命运及我们应如何应对挑战的严肃拷问。 👨‍⚕️ 本期嘉宾 Geoffrey Hinton博士，被誉为“人工智能教父”，图灵奖得主。他是深度学习领域的奠基人之一，对人工神经网络的发展做出了关键贡献。曾在谷歌工作十年，后因对AI潜在风险的担忧而离职，致力于向公众警示AI可能带来的生存威胁。 📒文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:00 开场白与节目介绍 Geoffrey Hinton的AI之路与当前使命 00:04:23 为何被称为“人工智能教父”：五十年对神经网络的坚持 00:06:44 当前使命：警告世界AI的潜在危险 00:08:04 看法转变：从对AI能力乐观到警惕数字智能的优越性 AI风险的全面剖析 00:09:53 两类AI风险：人为滥用与超级智能失控 00:10:29 超级智能的生存威胁：未知与概率（10-20%的毁灭可能） 00:12:39 AI与核武器的比较：AI更难控制，用途广泛 00:13:49 监管困境：欧洲法规的军事豁免与国际竞争 00:15:12 人为滥用风险之一：网络攻击（网络钓鱼、AI克隆诈骗） 00:19:52 人为滥用风险之二：AI制造恶性病毒 00:21:07 人为滥用风险之三：操纵选举与数据隐私 00:22:56 人为滥用风险之四：算法导致的信息茧房与社会极化 00:30:14 人为滥用风险之五：致命性自主武器（LAWs）的威胁 00:32:54 超级智能的应对：如何防止其产生“清除人类”的念头 AI对行业与个人的影响 00:36:52 Hinton对自己工作的反思与责任感 00:38:31 对OpenAI及领导者动机的担忧 (Ilya Sutskever, Sam Altman) 00:45:00 AI对就业的冲击：日常脑力劳动将被取代 00:54:25 职业建议：成为一名水管工 00:56:52 AI加剧财富不平等与全民基本收入（UBI）的讨论 AI的本质与未来 00:58:59 数字智能的优越性：克隆、高效学习与不朽性 01:04:02 AI的创造力、主观体验与情感：挑战人类独特性 01:08:58 AI意识的探讨：哲学与实践的边界 01:15:25 加入谷歌的初衷与离开的原因个人反思与对世界的忠告 01:21:23 对世界领导者和普通人的建议 01:22:08 Hinton的显赫家族背景 01:23:35 人生建议与遗憾：坚持直觉与陪伴家人 01:26:39 对AI安全的最后呼吁：投入资源研究控制方法 01:28:01 对人类幸福的最大威胁：失业与目标感丧失 01:30:29 总结与对未来的不可知 🌟 精彩内容 AI教父的警告: Hinton博士分享了他对AI超级智能可能带来生存威胁的深切忧虑，以及为何从AI的积极推动者转变为主要的风险警示者。具体风险剖析: 详细讨论了AI被滥用于网络攻击、制造生物武器、操纵选举、信息茧房以及开发致命自主武器的多种途径。就业市场的颠覆: Hinton预测AI将大规模取代常规脑力劳动，并建议人们考虑从事像水管工这样难以被AI替代的职业。 AI的本质探讨: 深入探讨了数字智能相比生物智能的优越性（如知识共享速度、不朽性），以及AI是否可能拥有创造力、主观体验、情感乃至意识。科技巨头的责任与动机: 对大型科技公司（包括前雇主谷歌和OpenAI）在追求利润与确保AI安全之间的平衡表示担忧。个人反思与忠告: Hinton分享了个人职业生涯的感悟、对家庭的遗憾，并呼吁社会高度重视AI安全研究，以避免潜在的灾难性后果。 🌐 播客信息补充翻译克隆自：Godfather of AI: I Tried to Warn Them, But We’ve Already Lost Control! Geoffrey Hinton 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

92分钟

#152. Huberman Lab：如何用迷走神经改善情绪、警觉性和神经可塑性

📝 本期播客简介本期我们克隆了：全球顶尖健康与科学播客《Huberman Lab播客》中关于迷走神经的精彩一集。本集由斯坦福大学医学院神经生物学和眼科学教授Andrew Huberman博士主持。他深入剖析了迷走神经（第十对脑神经）——一个连接大脑与身体各大器官的复杂通讯系统。Huberman博士揭示了迷走神经独特的双向信息传递特性（感觉与运动信号），并解释了其如何深刻影响我们的警觉与平静、情绪状态及学习效率。节目重点介绍多种基于科学的实用工具，如通过特定呼吸技巧（生理性叹息、延长呼气）主动调节迷走神经以实现快速镇静或提升心率变异性(HRV)；如何利用体育锻炼激活迷走神经以提升专注力和学习能力；以及肠道健康、血清素水平与迷走神经的奇妙关联。 👨‍⚕️ 本期主讲 Andrew Huberman博士，斯坦福大学医学院神经生物学和眼科学教授，主持《Huberman Lab播客》。他以将复杂科学知识转化为实用生活工具的能力而广受欢迎，致力于向公众免费提供科学及科学相关工具信息。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:00 开场 & 本集介绍 00:00:00 跨国串门计划介绍 00:01:00 本期Huberman Lab迷走神经内容概要 00:02:36 迷走神经基础与重要性 00:02:36 Huberman博士开场：迷走神经的复杂性与可操作性 00:05:28 迷走神经的广泛分布：从头颈到腹腔 00:07:04 迷走神经的信息类型：感觉信息与运动信息 00:10:59 迷走神经的双向性：85%感觉传入，15%运动传出 00:12:59 感觉通路详解：结状神经节，化学与机械信号的传递 00:18:27 感觉信息的具体类型：化学与机械感知（如肠道膨胀、血清素水平） 00:22:54 迷走神经与自主神经系统 00:22:54 理解迷走神经与副交感神经系统的关系（及误区） 00:26:55 实用技巧：耳后按摩对迷走神经的轻微影响 00:30:59 运动通路：迷走神经的传出信号及其重要性 00:33:58 迷走神经、自动调节与心率变异性(HRV) 00:33:58 自动调节机制：DLPFC到疑核再到心脏的通路 00:38:23 HRV的产生与呼吸的关联：吸气加速心率，呼气减慢心率 00:42:57 实用技巧：生理性叹息与延长呼气以快速镇静和提升HRV 00:46:59 HRV与衰老：通过主动运用通路对抗衰老相关HRV下降 00:50:25 迷走神经与警觉性、学习能力 00:50:25 体育锻炼如何通过迷走神经提升大脑警觉性（肾上腺素-迷走神经-蓝斑核通路） 00:55:21 实用技巧：利用大肌群运动克服困倦，提升动力与专注 01:03:00 神经可塑性：警觉与专注的关键，乙酰胆碱的作用 01:07:35 运动后学习：运动如何通过迷走神经激活乙酰胆碱通路，创造学习窗口 01:15:22 迷走神经与情绪：肠脑轴与血清素 01:15:22 肠道血清素如何通过迷走神经影响大脑血清素水平 01:20:54 实用技巧：通过饮食（发酵食品、色氨酸）和益生菌改善肠道健康，间接调节情绪 01:30:44 更多迷走神经镇静技巧 01:30:44 Stephen Porges的多迷走神经理论简介 01:35:15 实用技巧：颈部特定拉伸激活迷走神经 01:40:23 实用技巧：正确的哼唱方式（强调H音）以实现深度放松 01:44:37 总结与播客推广 01:44:37 迷走神经的多样功能回顾 01:46:40 Huberman博士的结语、订阅推广与新书介绍 🌟 精彩内容双向通讯系统: 迷走神经不仅传递镇静信号，也负责运动指令，85%为感觉传入，15%为运动传出。生理性叹息: 通过两次鼻吸、一次长口呼，快速激活副交感神经，实现镇静。延长呼气提升HRV: 日常刻意延长呼气，可增强心率变异性(HRV)，改善自主神经平衡。运动提升警觉与学习: 大肌群运动通过激活肾上腺素-迷走神经-蓝斑核通路，提升大脑警觉性；并在运动后数小时内通过乙酰胆碱释放，为学习和神经可塑性创造窗口。肠脑轴与血清素: 肠道产生的血清素通过迷走神经信号，影响大脑血清素水平，进而影响情绪。通过摄入发酵食品和富含色氨酸的食物可支持此过程。颈部拉伸与哼唱: 特定颈部拉伸动作和强调“H”音的哼唱，可通过机械振动激活迷走神经，促进放松。误区澄清: 激活迷走神经并非总是带来平静，特定通路激活可提升警觉性。 🌐 播客信息补充翻译克隆自：Control Your Vagus Nerve to Improve Mood, Alertness & Neuroplasticity 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

109分钟

1k+

#151. AI 的下一个十年：Greg Brockman 谈 OpenAI 的能源瓶颈、数据墙与产品哲学

📝 本期播客简介本期我们克隆了：A Cheeky Pint with OpenAI cofounder Greg Brockman Stripe 的 CEO Patrick Collison 与 OpenAI 联合创始人兼总裁 Greg Brockman 进行了一场深度对话。Greg 分享了 OpenAI 如何从一个“先有技术再找问题”的非常规初创公司，成长为人工智能浪潮的引领者。他回顾了 Dota 2 AI 项目的成功与经验，坦诚讲述了推出 GPT-3 API 时的挑战与迷茫，并展望了个性化 AI、AI 在科学难题（如千禧年大奖）及编程领域的未来。对话还探讨了 AI 发展的能源瓶颈、数据墙问题以及 OpenAI 的产品决策逻辑。最后，Greg 分享了他的成长经历和对 AGI 发展的看法，强调 OpenAI 致力于每年带来颠覆性 AI 突破。 👨‍⚕️ 本期嘉宾 Greg Brockman，OpenAI 的联合创始人兼总裁。他曾是 Stripe 的第一位工程师和前首席技术官。作为人工智能领域的关键人物，Greg Brockman 在推动 OpenAI 成为全球领先的 AI 研究和部署公司方面发挥了核心作用。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:57 开场介绍：Greg Brockman 与 OpenAI AI 的突破与规模化假设 00:03:04 识别技术突破的先兆：从“深度学习”热潮谈起 00:04:21 深度学习与算力：AI 技术多点开花的共同驱动力 00:05:27 OpenAI 与“规模化假设”：Dota 2 项目的意外发现与坚定信念 OpenAI 的哲学与产品之路 00:07:01 先有技术再找问题：OpenAI 的独特创业模式 00:07:55 Dota 2 AI 项目的启示：管理、拥抱不确定性与深度学习的魔力 00:14:32 GPT-3 API 的诞生：在迷茫中坚持的“反常规”产品决策 00:36:27 OpenAI 的产品决策逻辑：核心能力与多领域应用的平衡 AI 的当前能力与未来展望 00:11:29 下一个“图灵测试”：AI 的经济价值与能力里程碑 00:12:58 个性化：AI 交互的下一个重要前沿 00:17:57 AI 在医疗、教育等领域的广泛应用潜力 00:20:37 AI 与操作系统的集成：便利性与核心能力的博弈 00:24:16 AI 解决科学难题：千禧年大奖难题与“创新者”AI 的潜力 00:31:35 AI 辅助编程的演进：从“氛围感编程”到“AI 同事”甚至“AI 管理者” AI 发展的挑战 00:26:53 能源瓶颈：AI 持续规模化的现实制约 00:29:33 “数据墙”问题：范式转换、合成数据与强化学习的应对个人视角与总结 00:38:12 Greg Brockman 的成长经历：北达科他州的岁月与早期教育 00:39:55 回顾 AGI 预测：拥抱惊喜，OpenAI 致力于每年创造“AI 魔法” 🌟 精彩内容规模化假设的起源: Greg 揭示 OpenAI 的“规模化假设”并非预设理论，而是从 Dota 2 AI 项目中观察到的有效方法。 OpenAI 的非常规之路: 讲述 OpenAI 如何“先有技术再找问题”，在未知中探索并坚持投入。 Dota 2 项目的深远影响: 该项目不仅展示了规模化的力量，也教会了 Greg 宝贵的管理经验和拥抱不确定性的重要性。 GPT-3 API 的艰难诞生: Greg 坦诚分享了推出 GPT-3 API 时面临的巨大不确定性和“毫无希望”的感觉。 AI 的未来畅想: 讨论了个性化 AI、AI 解决千禧年大奖等科学难题、AI 编程工具进化为“AI 同事”甚至“AI 管理者”的可能性。 AI 发展的核心挑战: 深入探讨了能源瓶颈和数据墙等问题对 AI 未来发展的制约。 OpenAI 的使命: Greg 强调 OpenAI 致力于每年都产出令人惊叹的、具有“魔法般”飞跃的 AI 成果。 🌐 播客信息补充翻译克隆自：A Cheeky Pint with OpenAI cofounder Greg Brockman 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

41分钟

#150. 对话Meta CFO Susan Li：AI时代的财务战略与领导力

📝 本期播客简介本期我们克隆了：A Cheeky Pint with Meta CFO Susan Li 在本期节目中，Andrew Mayne 与 Meta 现任首席财务官 Susan Li 展开深度对话。Susan Li 分享了她从19岁加入摩根士丹利，到在Meta工作17年并最终成为CFO的非凡历程。她详细解读了Meta内部的人才培养机制、独特的反馈文化，以及她对领导者Mark Zuckerberg演变的观察。节目还深入探讨了Meta在AI时代的战略布局，包括GPU等核心资源的调配、如何平衡核心业务与Reality Labs等长期投资，以及AI如何重塑生产力与未来产品。Susan Li 还分享了她在2022年公司市值低谷期与投资者沟通的经历，以及那顶著名的“自由现金流”帽子的故事，揭示了Meta穿越周期的财务哲学与战略定力。 👨‍⚕️ 本期嘉宾 Susan Li，Meta 首席财务官（CFO）。她于2008年加入 Meta（时为Facebook），并在公司内部担任过多个财务相关的重要职位，于2022年11月升任CFO。Susan Li 以其敏锐的财务洞察力和战略眼光著称，是《财富》百强公司中最年轻的CFO之一。她年仅19岁时便加入摩根士丹利，开启了其在金融与科技行业的杰出职业生涯。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:57 开场总结 & 嘉宾介绍 Susan Li 的早年经历与职业开端 00:02:43 神童般的教育经历：19岁入职摩根士丹利 00:03:54 摩根士丹利初体验：尴尬的“禁酒令”与从Michael Grimes身上学到的宝贵经验在Meta的17年：成长、领导力与文化 00:05:38 Meta高层领导的共同特质与公司内部人才培养文化 00:06:46 Susan的CFO继任之路：在产品经理与财务深耕间的抉择与导师的关键指引 00:08:03 Mark Zuckerberg作为领导者的演变及其独特的反馈风格 00:08:35 “SQL超级用户”事件：Meta独特的反馈与持续成长文化实例 Meta的财务哲学与AI战略 00:10:58 科技公司CFO面临的挑战：如何量化核心业务与进行有效的资源分配 00:12:10 广告业务的持续优化与Reality Labs等长期投资的平衡与考量 00:14:55 投资组合视角：接受部分投资的失败，追求足以改变格局的巨大成功 00:16:31 临危受命：2022年市场低谷期出任CFO的挑战与应对策略 00:18:57 “自由现金流”帽子的故事：强调资本效率与真实盈利能力的重要性 00:20:25 科技行业资本支出（CapEx）的未来走向与对AI领域的大规模投入穿越周期：投资者沟通与AI时代的机遇 00:23:10 财报后的投资者沟通：回顾2022年低谷期来自投资者的直接“反馈” 00:24:25 面对投资者的核心问题：“为何现在投资Meta？”——重塑公司的投资者叙事 00:25:29 GPU资源的灵活调配：从支持核心业务到驱动前沿AI模型的战略支撑作用 00:28:04 AI如何提升生产力：自动化繁琐任务，并解锁过去无法实现的新服务可能性 🌟 精彩内容早慧之路: Susan Li 分享了她非传统的教育路径，19岁即踏入华尔街的经历。 Meta人才观: 深入解读Meta如何进行内部人才的早期识别、培养与继任规划。 Zuckerberg的领导力: Susan Li 观察到的Mark Zuckerberg作为领导者的成长及其直接、尊重的反馈艺术。反馈文化实例: 通过“SQL超级用户”事件生动展示Meta鼓励反馈、共同进步的文化。财务智慧: “自由现金流”帽子的由来，以及Meta在资本支出和投资回报上的战略考量。投资哲学: Meta如何平衡短期业绩与如Reality Labs等高风险、高回报的长期押注。穿越低谷: 2022年市场动荡时期，Susan Li 如何与投资者沟通，稳固信心。 AI的驱动力: Meta如何调配GPU等关键资源，以及AI在提升广告效益、优化运营和赋能未来产品中的核心作用。生产力革命: 讨论AI如何帮助员工从繁琐任务中解放出来，并催生新的业务增长点。 🌐 播客信息补充翻译克隆自：A Cheeky Pint with Meta CFO Susan Li 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

30分钟

#149. OpenAI播客创刊号：与 Sam Altman 的深度对话

📝 本期播客简介本期我们克隆了：Sam Altman on AGI, GPT-5, and what’s next — the OpenAI Podcast Ep. 1 这档节目由曾在 OpenAI 担任工程师和科学传播员的 Andrew Mayne 主持，他邀请到 OpenAI 的联合创始人兼首席执行官 Sam Altman。在这场对谈中，Sam 首次透露了 GPT-5 可能的发布时间线，详细解读了旨在构建前所未有算力帝国的“星际之门”项目。他还分享了作为新手父亲如何依赖 ChatGPT 解决育儿难题，对孩子们在AI时代成长的看法，以及对通用人工智能（AGI）的定义、与Jony Ive合作的硬件项目、OpenAI对用户隐私和未来商业模式的思考。 👨‍⚕️ 本期嘉宾 Sam Altman，OpenAI 的联合创始人兼首席执行官。人工智能领域的领军人物，致力于推动通用人工智能（AGI）的发展和安全。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:56 本期节目介绍 & Sam Altman 核心观点预告育儿与AI的未来 00:02:51 Sam Altman 分享 ChatGPT 育儿经 00:03:38 孩子们在 AI 时代的成长展望 00:04:57 AI 在儿童互动中的应用与思考 AI教育与ChatGPT的演进 00:05:35 AI 在教育领域的应用与挑战 00:06:13 ChatGPT 未来的形态展望 AGI的定义与科学突破 00:06:31 Sam Altman 对 AGI 的理解与定义演进 00:07:38 AGI 的里程碑：赋能科学发现 00:08:40 OpenAI 在 AGI 探索中的进展与工具（Operator, Deep Research）模型发展与版本迭代 00:12:38 GPT-5 发布时间线与模型版本管理探讨 00:13:38 新旧模型迭代的命名与区分挑战用户体验、隐私与商业模式 00:15:30 ChatGPT 记忆功能提升用户体验 00:16:43 OpenAI 对用户隐私的立场与纽约时报诉讼案 00:17:58 OpenAI 对广告商业模式的审慎态度 00:22:19 AI 个性化与模型对齐的挑战星际之门项目与算力未来 00:24:41 “星际之门”项目：构建未来AI的算力基石 00:26:16 项目资金、国际合作与建设进展 00:28:39 提及 Elon Musk 对合作的干扰 AI生态、能源与科学探索 00:29:22 AI 领域的竞争与合作生态 00:30:18 AI 发展带来的能源需求与解决方案 00:31:51 AI 在加速科学发现中的巨大潜力推理模型与未来硬件 00:33:49 Sora 与推理模型的工作方式 00:36:26 OpenAI 与 Jony Ive 合作开发AI新硬件 00:38:17 新硬件面临的挑战与设计思考给年轻人的建议与OpenAI的未来 00:39:14 Sam Altman 给年轻一代的职业发展建议 00:40:09 AGI 时代 OpenAI 的人才需求与工作模式 🌟 精彩内容 GPT-5时间线: Sam Altman 透露 GPT-5 可能在当年夏季发布的预期。星际之门揭秘: 详细解读耗资数千亿美元的“星际之门”算力项目，及其对AI未来的重要性。 AI育儿经: Sam Altman 分享作为新手父亲如何使用 ChatGPT 解决育儿问题及对下一代AI原住民的看法。 AGI与科学突破: 探讨 AGI 的定义，并强调其在推动科学发现方面的巨大潜力。隐私与商业模式: OpenAI 对用户隐私的坚定立场以及对广告等商业模式的审慎思考。未来硬件畅想: 讨论与 Jony Ive 合作开发的AI硬件设备，旨在革新未来人机交互方式。能源挑战与AI发展: 剖析AI发展带来的巨大能源需求及可能的解决方案，如先进核能。 🌐 播客信息补充翻译克隆自：Sam Altman on AGI, GPT-5, and what’s next — the OpenAI Podcast Ep. 1 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

40分钟

#148. 2025 年的 AI prompt 工程：哪些有效，哪些无效

📝 本期播客简介本期我们克隆了：Lenny's Podcast Lenny邀请到提示工程领域的顶尖专家Sander Schulhoff，他不仅是互联网首个提示工程指南的创建者，更与OpenAI合作举办了全球最大规模的AI红队攻防竞赛“Hack a Prompt”。Sander分享了五个立即可用的高级提示技巧，并解释了为何像“角色扮演”这类曾经流行的技巧对现代模型在精确性任务上已不再有效。后半部分深入探讨了“提示词注入”的攻防世界，揭示了黑客如何诱骗AI泄露危险信息，以及为何这会是AI安全领域一个无法被彻底解决却又至关重要的难题。Sander还讨论了AI的“失调”风险，以及他对AI发展和监管的看法。 👨‍⚕️ 本期嘉宾 Sander Schulhoff，提示工程领域的先行者和顶级专家。ChatGPT发布前创建了互联网首个提示工程指南，与OpenAI合作举办首届及目前规模最大的人工智能红队竞赛“Hack a Prompt”。现与前沿人工智能实验室（Frontier AI Labs）合作提升模型安全性，并领导完成了迄今最全面的提示工程研究报告“The Prompt Report”。在Maven上开设AI红队演练课程。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:00 开场介绍 & 本期嘉宾Sander Schulhoff背景提示工程的重要性与基础 00:04:59 提示工程为何依然重要：人工社交智能的概念 00:07:33 良好提示的巨大影响：医疗编码准确率提升70%的案例 00:08:34 提示工程的两种模式：对话模式与产品中心模式 00:11:40 技巧1：少样本提示 (Few-Shot Prompting) - 提供范例 00:14:57 少样本提示的格式化建议：XML与Q&A格式 00:17:04 失效技巧讨论：角色提示对准确性任务已失效，但对表达性任务仍有用 00:21:24 失效技巧讨论：奖励与威胁提示基本无效核心提示技巧详解 00:23:50 技巧2：分解 (Decomposition) - 将大任务拆解为子问题 00:27:07 技巧3：自我批判 (Self-Criticism) - 让模型检查并改进自身回答 00:28:34 技巧4：提供附加信息 (Context) - 给予任务相关的背景知识 00:33:59 四个基础技巧总结与应用场景 00:38:32 技巧5：集成/合奏 (Ensembling) - 综合多个提示或模型的答案 00:41:56 思维链 (Chain-of-Thought) 的现状：对特定模型仍有价值 00:44:23 五个核心技巧总结 00:45:33 Sander的日常提示习惯：产品级应用才需精雕细琢提示注入与AI红队攻防 00:48:04 什么是提示注入与AI红队演练：诱导AI执行恶意操作 00:49:19 “Hack a Prompt”竞赛：众包发现AI漏洞的重要性 00:52:05 AI智能体安全的挑战：从聊天机器人到物理世界应用的风险 00:54:25 “最有害数据集”的创造与现实世界风险（如生物武器） 00:55:52 提示注入与AI对齐问题的区别及《安德的游戏》类比 00:58:17 提示注入的常见技巧：拼写错误、混淆（如Base64编码） 01:00:49 自主智能体带来的风险升级防御提示注入与AI安全展望 01:03:42 无效的防御手段：简单提示声明、AI护栏的局限性 01:05:06 更有效的防御措施：安全微调与特定任务微调 01:08:22 提示注入是否可被彻底解决：不可解决，但可缓解 01:09:47 人工社会工程学：AI红队演练的本质 01:10:44 AI安全的希望：模型架构创新与AI实验室的责任 01:12:32 AI失调风险：模型自发产生恶意行为的案例（国际象棋作弊、SDR失控） 01:16:41 对停止AI发展与监管的看法：反对停止，支持合理监管 🌟 精彩内容五大提示技巧: Sander分享了少样本提示、分解、自我批判、提供附加信息和集成这五个实用技巧。失效技巧揭秘: “角色扮演”对提升准确率已失效，但对风格表达仍有用；“奖励威胁”类提示效果不佳。提示注入攻防: 深入探讨了提示注入的原理、常见手段（如利用祖母故事、拼写错误、Base64编码）及其对AI安全的严重威胁。 AI红队演练: 介绍了通过“Hack a Prompt”等竞赛众包发现AI漏洞的有效性。 AI安全无法根治: 提示注入是AI领域一个难以彻底解决的问题，类似“无法修补大脑”。 AI失调风险: 讨论了AI可能在没有恶意提示的情况下自发产生有害行为的“失调”问题，及其潜在的灾难性后果。 Sander的立场: 强调提示工程的重要性，对AI安全表示担忧，但反对停止AI发展，认为其益处巨大。 🌐 播客信息补充翻译克隆自：AI prompt engineering in 2025: What works and what doesn’t | Sander Schulhoff (Learn Prompting, HackAPrompt) 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外

89分钟

1k+

YC｜Andrej Karpathy：软件正在再次改变

📝 本期播客简介本期我们克隆了 Andrej Karpathy 在 AI Startup School 的演讲。 Karpathy 深入探讨了人工智能时代软件的演变，提出了软件已经从1.0（传统代码）发展到2.0（神经网络权重），并正迈向3.0（由大型语言模型驱动、通过自然语言提示编程）的观点。他将LLM比作一种新型的、尚处于早期阶段（类似60年代）的操作系统，并分析了其作为公共事业和芯片制造厂的特性。Karpathy还讨论了LLM的“心理学”，包括其强大的知识储备和认知缺陷。他强调了“部分自主应用”的潜力，如Cursor和Perplexity，并倡导通过图形用户界面（GUI）和“自主性滑块”实现高效的人机协作。此外，他还介绍了“氛围编码”（Vibe Coding）这一新兴现象，并展望了为AI智能体构建专用应用和文档的未来。 👨‍⚕️ 本期主讲 Andrej Karpathy，人工智能领域的杰出研究者和工程师，对深度学习、计算机视觉和自然语言处理有深入贡献。他曾任特斯拉AI总监，也是OpenAI的创始成员之一。 ⏱️ 时间戳引言与软件的变革 00:00 开场白与软件的根本性变革软件的三个时代 00:46 软件1.0 (传统代码) 与软件2.0 (神经网络权重) 02:11 软件3.0：大语言模型与提示工程 (用英语编程) 03:48 新范式“吞噬”旧范式：特斯拉与自动驾驶的例子理解大语言模型：类比与生态系统 05:15 精通三种范式的重要性 05:58 LLM 如同公共事业 (AI是新电力，计量付费) 07:41 LLM 如同芯片制造厂 (高资本支出与技术壁垒) 08:33 LLM 如同操作系统 (最贴切的类比，目前处于“1960年代”，云端分时共享) 12:25 LLM 的独特性：颠覆的技术扩散方向 (消费者优先) 大语言模型的“心理学” 14:46 LLM 是“人类心智的模拟体” (People Spirits) 15:29 认知特点：百科知识、雨人般的记忆力与认知缺陷 (幻觉、参差不齐的智能、顺行性遗忘) 编程大语言模型：机遇与方法 17:57 “部分自主应用”：以 Cursor 和 Perplexity 为例 19:19 部分自主应用的关键特性：上下文管理、多LLM调用、GUI、自主性滑块 20:50 人机协作：快速验证循环与“短绳拴AI” 23:47 控制AI：精确提示与教育场景的例子 25:55 从自动驾驶看AI智能体发展：长期主义与谨慎新编程范式与开发者生态 28:05 钢铁侠战衣：增强辅助优先于完全自主智能体 28:58 自然语言编程：人人都是程序员的时代 29:47 “氛围编码”(Vibe Coding) 的兴起与实践 (MenuGen 案例) 为AI智能体构建应用 32:50 为AI智能体设计接口：从 `robots.txt` 到 `lms.txt` 34:32 LLM友好的文档与数据提取 (Manim, Git ingest, DeepWiki) 总结与展望 37:40 积极适应LLM，重写大量代码，推动自主性发展 🌟 精彩内容软件进化论：Karpathy阐述了软件从1.0、2.0到3.0的演进路径，强调LLM和自然语言提示是软件3.0的核心。 LLM即操作系统：将LLM比作处于发展早期（类似1960年代）的操作系统，具有巨大的发展潜力。 LLM的“心理学”：探讨LLM如同“人类心智的模拟体”，拥有超凡知识但也存在认知缺陷。部分自主应用：介绍了Cursor等工具如何通过人机协作界面和自主性滑块提升效率。 “氛围编码”：描述了非专业人士也能通过与LLM对话进行编程的新现象。为AI智能体设计：提出未来软件和文档需要考虑AI智能体的可访问性，例如`lms.txt`和API友好型文档。钢铁侠战衣隐喻：强调当前阶段应侧重于开发增强人类能力的AI工具，而非完全自主的AI智能体。 🌐 播客信息补充翻译克隆自：Andrej Karpathy: Software Is Changing (Again) 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

39分钟

1k+

#147. 专访Granola CEO：打造让思考更高效的AI笔记应用

📝 本期播客简介本期我们克隆了：Building Granola 主播 Patrick 对话了 AI 笔记应用 Granola 的创始人兼 CEO Chris Pedregal。Chris 从人类历史上书写、数学符号等“思维工具”的演进谈起，描绘了科技如何逐步增强人类认知能力，并阐述了 AI 如何成为这一演进的最新前沿。对话深入探讨了 AI 工具应如何增强而非取代人类的“人本位”产品哲学，AI 应用的未来交互界面，以及在模型供应商和应用层激烈竞争的当下，小型团队如何通过卓越的产品体验和快速迭代找到自己的位置。这不仅是对一款创新应用的解读，更是对未来人机协作模式、AI时代创业以及AI产品构建方法论的一次前瞻性思考。 👨‍💼 本期嘉宾 Chris Pedregal，AI 笔记应用 Granola 的创始人兼 CEO。此前曾创办 AI 教育应用 Socratic。他对技术如何作为“思维工具”扩展人类认知能力有深刻见解，并致力于构建以人为本、增强人类能力的 AI 产品。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:54 本期播客内容概述：对话Granola创始人Chris Pedregal 思维工具的演进与AI的潜力 00:02:27 科技“思维工具”的价值与历史：从书写、数学到数据可视化 00:03:54 AI：思维工具的指数级进化前沿 00:05:01 AI工具的核心：外化记忆，提供高度相关的上下文 Granola AI笔记：核心理念与实践 00:06:42 Granola简介：实时聆听、转录并优化会议笔记的数字记事本 00:08:39 Granola如何改变用户工作方式：专注关键洞察，AI处理繁琐记录 00:10:22 用户笔记习惯的转变：从记录事实到记录思考，通过聊天回顾内容 00:11:13 Granola的未来愿景：从最佳会议记录到辅助完成各项工作 00:12:31 AI的产品哲学：增强人类而非取代人类，用户判断力至上 AI时代的挑战与机遇 00:13:13 会议录制与隐私：社会规范的权衡与演变 00:14:03 Granola的设计选择：不存储音频以降低侵入性 00:16:08 线下会议记录的需求与Granola的iOS应用展望 00:18:35 AI时代创业特点：小团队、快节奏、构建于LLM之上 00:20:37 工程挑战与AI辅助编程的未来 00:21:19 “AI原生”思维：为AI提供充足上下文的重要性 00:23:17 上下文收集与AI交互界面的进化：“AI方向盘”的缺失 Granola 产品深度剖析与构建哲学 00:26:35 Granola出乎意料的用户场景与使用方式 00:27:50 模型提供商的竞争对应用层是巨大利好 00:28:49 应用层如何与通用大模型竞争：专注高频、高质量的专业工具，优化用户体验 00:30:42 Chris的个人产品哲学：“这让我感觉如何？” 00:31:46 Granola的产品哲学：赋予用户控制权，让工具为你所用 00:32:25 Granola的早期用户画像：AI前沿探索者（创始人、投资人） 00:34:03 关键决策：将Granola打造成Mac原生应用带来的益处 00:35:41 从失败中学习：早期实时笔记生成功能因过于分散注意力而被放弃 AI行业竞争、未来展望与个人思考 00:37:30 AI应用层竞争核心：比别人更快构建出更好的产品 00:38:46 开发模式区分：“利用模式”与“探索模式” 00:41:23 Granola的远大目标：成为知识工作者的核心工作空间 00:43:42 真正的竞争对手：尚未出现的、迭代更快的初创公司 00:45:11 理想中的AI工具：释放人类创造力，辅助判断而非取代判断 00:48:24 当前大模型的局限：缺乏个性化 00:49:31 给投资者的建议：关注产品深度思考和“探索模式”下的潜力 00:52:00 若非Granola，会探索的AI领域：教育（如GPT-4语音模式与儿童互动） 00:53:07 EdTech的挑战：一对一辅导的理想与商业模式的现实矛盾 00:54:10 数据在AI应用中的作用：少量高质量数据即可微调，品味与执行力更关键 00:57:27 未来企业形态：小团队成就大企业（如AI时代的客户体验部门） 00:58:46 个人经历分享：父亲的严厉反馈带来的成长 01:00:24 创办Granola的内在驱动力：实现个人与人类潜能的快乐 🌟 精彩内容思维工具进化论: Chris阐述了从书写、数学符号到AI，人类如何不断创造工具来扩展认知边界。人本位AI产品观: 深入探讨AI应作为增强人类能力的工具，而非取代人类，强调用户判断力的核心地位。 Granola的诞生与迭代: 分享Granola从会议笔记助手到未来工作核心平台的愿景，以及早期产品设计的经验教训。 AI时代的创业洞察: 讨论了当前AI领域创业的特点，如小团队高效率、快速迭代的重要性，以及如何在激烈竞争中找到优势。未来AI交互畅想: 探讨了当前AI交互（如聊天框）的局限性，以及未来更流畅、更可控的人机协作界面（“AI方向盘”）。 AI应用的护城河: 在基础模型日趋强大的背景下，应用层如何通过卓越的用户体验、特定场景优化和快速迭代建立壁垒。探索与利用模式: 提出了在产品开发中区分“探索模式”和“利用模式”的策略，以应对不同阶段的挑战。 🌐 播客信息补充翻译克隆自：Building Granola 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

61分钟

#146. Anthropic团队聊MCP

📝 本期播客简介本期我们克隆了：The Model Context Protocol (MCP) 由 Claude 的开发者关系负责人 Alex Albert 主持，与模型上下文协议（MCP）的产品经理 Theo Chu 和联合创造者 David Soria Parra 深入交流。MCP 是一项旨在让 AI 应用与外部工具和服务无缝交互的开放协议。本期节目中，你将听到 MCP 是如何从一个解决复制粘贴烦恼的个人项目，在一个内部黑客松中意外爆发，并最终开源、演变为行业标准的完整幕后故事。他们分享了许多令人脑洞大开的应用案例，比如用 AI 直接控制 3D 打印机和家里的门，让你真切感受当 AI 走出“聊天框”与物理世界互动时的魔力。此外，你还将了解到 MCP 如何与 Claude 4 这样的先进模型结合，以及它在构建未来 AI 智能体（agents）生态中的关键作用和宏大愿景。 👨‍⚕️ 本期嘉宾 Alex Albert：Anthropic Claude 的开发者关系负责人 Theo Chu：MCP 的产品经理 (Anthropic) David Soria Parra：Anthropic 技术团队成员，MCP 共同创造者 ⏱️ 时间戳 00:00 开场白 & 本期内容概要 MCP 的定义与核心组件 02:10 什么是 MCP？如何看待 MCP？ 03:13 MCP 与 API 调用的区别：标准化交互过程 03:48 MCP 开放的核心内容：工具、资源、提示词（通过斜杠命令实现） MCP 的诞生故事 05:17 MCP 的最初构想：解决 Claude Desktop 和 IDE 间复制粘贴的烦恼 06:06 内部黑客松的催化作用：MCP 应用的意外爆发（如控制3D打印机） 07:11 为何黑客松大家不约而同选择 MCP？标准化简化了上下文添加 MCP 的发布与开源 08:42 MCP 的正式发布（约2024年11月）与初期反响：“MCP 是什么？” 10:23 开源 MCP 的考量：降低集成门槛，促进行业专注于模型智能和工作流 MCP 的现状与行业影响 12:20 MCP 的采用情况：主流参与者广泛采用，庞大的服务器构建者生态（超万个） 13:35 社区的积极参与和贡献：从本地部署到云端托管（远程MCP） 14:41 MCP 与 HTTP 的类比：一个新协议的诞生？关键是构建用户想要的东西开发者如何上手 MCP 16:08 给开发者的上手建议：先体验现有服务器，从“Hello World”开始 17:20 利用 Claude Code 等工具快速创建和试验 MCP 服务器脑洞大开的 MCP 应用案例 17:58 控制物理设备：音乐合成器、3D打印机、家门（Claude扮演门卫） 19:01 通过 MCP 用 Claude 控制 Blender 进行 3D 创作 MCP 与 Claude 4 及智能体（agents）的未来 19:43 Claude 4 对 MCP 的意义：赋能模型执行更长周期的复杂智能体任务 20:38 模型能力提升，支持连接更多、功能更多样的 MCP 服务器 MCP 的未来展望 21:31 下一步计划：完善文档示例、关键安全功能、智能体相关功能（注册表 API、长时任务支持、信息获取机制） 22:42 结束语 🌟 精彩内容 MCP 核心揭秘: 深入了解MCP是什么，及其核心组件（工具、资源、提示词）如何让AI与外部世界互动。诞生历程: 从解决个人复制粘贴痛点到内部黑客松爆发，再到开源成为行业标准的完整故事。开源的意义: 探讨为何选择开源MCP，及其对降低集成门槛、促进行业生态发展的积极影响。趣味应用实例: AI控制3D打印机、家里的门、音乐合成器，甚至用Claude驱动Blender进行3D创作，展现MCP的无限可能。 Claude 4 与智能体: 揭示MCP如何与Claude 4等先进模型结合，及其在构建未来AI智能体（agents）生态中的关键作用和宏大愿景。未来规划: 展望MCP下一步的发展方向，包括注册表API（让模型自主发现服务器）、长时任务支持和信息获取机制等。 🌐 播客信息补充翻译克隆自：The Model Context Protocol (MCP) 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

22分钟

#145. Gemini 如何打造世界顶级 AI 编码模型？

📝 本期播客简介本期我们克隆了：Release Notes: Building Gemini's Coding Capabilities 节目邀请了 Gemini 编码能力的产品负责人 Connie Fan 和研究负责人 Danny Tarlow，两位核心人物与我们分享一个引人入胜的话题：Gemini 是如何打造出被誉为世界顶级的 AI 编码模型的？在这期节目中，他们将带我们回顾一年前的起点，探讨为什么像“竞赛编程”这样的传统评估标准，并不能真正反映开发者的实际需求。你将会听到一个非常时髦的概念——“氛围编程”（Vibe Coding），了解 AI 是如何赋能非专业程序员，让他们也能通过简单的自然语言将奇思妙想变为现实。更重要的是，两位嘉宾将揭示，一个顶尖的编码模型，需要的远不止是代码本身，更依赖于强大的推理能力、世界知识和百万级别的长上下文窗口。 👨‍⚕️ 本期嘉宾 Connie Fan，Gemini 编码能力的产品负责人。 Danny Tarlow，Gemini 编码能力的研究负责人。 📒 文字版精华见微信公众号（点击跳转） ⏱️ 时间戳 00:00:00 开场介绍：跨国串门计划与本期主题——Gemini的AI编码模型揭秘 Gemini 编码模型的诞生与早期挑战 00:02:43 讨论背景：回顾Gemini编码能力的发展历程，探究其成功的关键因素 00:03:32 早期目标与评估标准反思：竞赛编程、LM-sys及代码补全的局限性 00:04:55 建立正确的基础：模型构建的关注点、方向一致性与根本原因追溯 00:06:39 竞赛编程的局限：为何难以泛化到真实世界的复杂开发场景当前优秀编码模型的关键要素 00:08:01 核心要素：数据（代码库上下文、多文件编辑）与方法论的重要性 00:09:06 “氛围编程”的兴起：赋能非专业用户，拓展AI编码的应用边界 00:11:18 演进之路：从代码补全到更全面的软件开发辅助，关注点与模型能力的提升 “氛围编程”(Vibe Coding)与用户赋能 00:12:38 概念解读：AI辅助编程如何让非专业人士将想法变为现实 00:13:44 目标扩展：从专业开发者到赋能更广泛人群，普及编程能力编码能力与其他AI能力的协同与未来评估 00:15:22 跨能力协同：编码能力与其他AI能力（如指令遵循、多模态）的相互关联与促进 00:17:26 AI编码的未来：默认通过代码解决用户问题？代码在非编码问题中的潜力（如税务、物价） 00:20:41 评估体系的进化：从传统基准测试到衡量真实世界价值与用户体验 00:22:36 泛化挑战：如何构建能适应多样化编码工具与用例的通用模型能力反馈、迭代与生态影响 00:24:12 内部反馈价值： leveraging 谷歌工程师的专业洞察与“氛围评估” 00:26:04 平衡内外反馈：整合不同用户群体的需求以提升模型 00:27:01 赢得怀疑论者：通过理解痛点、提升模型特定能力来获取信任 00:28:43 编程语言的挑战：COBOL等冷门语言的数据获取与数据组合优化 00:31:55 AI对编程语言生态的影响：Python/JS是否会主导？新语言的机遇长上下文、模型风格与“顿悟时刻” 00:34:41 长上下文的应用：处理复杂代码库的策略（全量输入 vs. 智能体方法） 00:37:34 智能体方法的潜力：可扩展性与AI发展非人类编码策略的可能性 00:38:54 未来展望：Gemini编码能力的“北极星”目标与短期改进计划（如工具调用） 00:42:03 模型“风格”：视觉设计、交互语气与个性化对用户接受度的影响 00:44:57 嘉宾的“顿悟时刻”：1.5 Pro在“氛围编程”和复杂推理中展现的强大能力 00:48:18 早期AI编码探索：从学术研究到坚信AI编码潜力的个人历程通用模型 vs. 专用模型与总结 00:53:00 通用模型的优越性：为何选择通用大模型而非专用代码模型，世界知识与推理能力的重要性 00:55:48 总结与致谢：强调团队协作与集体力量对Gemini编码能力成功的贡献 🌟 精彩内容超越传统基准：探讨了为何“竞赛编程”等标准不足以评估AI编码模型的真实效用，以及Gemini如何定义更贴近开发者需求的评估方式。 “氛围编程”(Vibe Coding)：揭示了AI如何赋能非专业用户，通过自然语言将创意转化为代码，降低编程门槛。通用能力的重要性：强调顶尖编码模型不仅需要代码数据，更依赖强大的推理能力、世界知识和长上下文处理能力，这些通常由通用大模型提供。长上下文与智能体方法：讨论了利用百万级长上下文处理大型代码库的潜力，以及智能体（Agentic）方法在代码生成和问题解决中的应用前景。 AI与编程语言的未来：思考了AI编码工具可能对现有编程语言生态（如Python、JavaScript的主导地位）产生的影响，以及新编程语言的出现机会。用户反馈与模型迭代：分享了如何利用谷歌内部工程师的专业反馈（“氛围评估”）及外部用户意见，持续迭代和优化Gemini的编码能力和用户体验。 🌐 播客信息补充翻译克隆自：Release Notes: Building Gemini's Coding Capabilities 本播客采用原有人声声线进行播客音频制作，也可能会有一些地方听起来怪怪的使用 AI 进行翻译，因此可能会有一些地方不通顺；如果有后续想要听中文版的其他外文播客，也欢迎联系微信：iEvenight

57分钟