📝 本期播客简介 本期播客中,OpenAI 宣布与 Broadcom 达成战略合作,共同设计和部署下一代 AI 计算基础设施。OpenAI 的 Sam Altman 和 Greg Brockman,以及 Broadcom 的 Hawk Tan 和 Charlie Kawas 共同探讨了这一合作的深度、规模及其背后的愿景。双方将共同设计定制芯片和系统,以期在未来几年内部署高达 10 亿瓦(10 GW)的计算能力。嘉宾们强调,这次合作旨在通过垂直整合优化整个技术栈,实现前所未有的效率提升,从而降低 AI 模型的成本,加速通用人工智能(AGI)的实现,并最终推动全球经济增长和社会进步。 (主播:还在迭代流程,这是新版的一个试水) 👨⚕️ 本期嘉宾 Sam Altman,OpenAI CEO Greg Brockman,OpenAI 联合创始人 Hawk Tan,Broadcom CEO Charlie Kawas,Broadcom 总裁 🌟 精彩内容 💡 史上最大工业项目 Sam Altman 认为,当前的 AI 基础设施建设是“人类历史上最大的联合工业项目”,需要多方合作、共同投入,以满足不断增长的智能计算需求。 💻 从晶体管到 Token 的垂直整合 OpenAI 与 Broadcom 的合作不仅仅是芯片设计,而是从底层晶体管制造、定制芯片、机架设计到网络连接、算法适配的全系统垂直整合。这种优化将使 OpenAI 能够从每瓦特中榨取更多的智能(Intelligence per Watt)。 🚀 10 吉瓦的巨大需求 到明年底,双方将部署 10 吉瓦的计算能力,加上 OpenAI 现有的部署,总容量将接近 30 吉瓦。Greg Brockman 指出,尽管这个数字是巨大的,但随着模型质量的提升和成本的降低,市场需求仍将迅速饱和,因为计算需求是永无止境的。 🧠 AI 辅助设计芯片 OpenAI 正在应用自己的模型来设计这款定制芯片,从而缩短时间表,实现人类设计师需要数月才能完成的优化。 🌍 计算富足的愿景 OpenAI 的目标是实现 “计算富足”,让 AI 技术普及到全世界,提升所有人的生产力。Greg 认为,目前计算资源仍相当稀缺,理想状态是每个人都有一个 24/7 运行的 AI 代理。 🌐 播客信息补充 翻译克隆自:OpenAI x Broadcom — The OpenAI Podcast Ep. 8 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期 Huberman Labs 讨了时间知觉这一核心主题。安德鲁·霍伯曼教授解释了我们对时间的感知如何受神经化学状态(如多巴胺和血清素)以及生物节律(年节律、昼夜节律、超昼夜节律)的强烈影响。了解这些机制不仅能帮助我们管理情绪和压力,还能提供基于科学的实用工具,如光照调谐和90分钟工作周期,以提升专注力和工作效率。此外,教授还揭示了多巴胺如何导致时间“超频”,以及为什么有趣的事情当下过得快,回顾时却显得漫长。 (PS: 最近在调整制作方式,会暂缓更新几天) 👨⚕️ 本期教授 安德鲁·霍伯曼(Andrew Huberman),斯坦福大学医学院神经生物学和眼科学教授。 🌟 精彩内容 💡 为什么你的专注力只能维持90分钟? 超昼夜节律决定了我们大脑进行高强度专注工作的最佳时间约为90分钟。这是因为乙酰胆碱和多巴胺等神经化学物质在大约90分钟后会显著下降,导致专注力衰退。因此,高效的工作流需要将高强度任务限制在这90分钟内,并进行间隔休息。 🧠 多巴胺如何扭曲你的时间感? 神经调节剂多巴胺与时间知觉密切相关。当多巴胺水平升高时,我们会倾向于高估流逝的时间。例如,在经历创伤或极度兴奋时,大脑会进入“超频”状态,感觉时间被细切,事物以慢动作发生。 ⏳ 时间知觉的悖论:回顾过去 经历越是新奇、有趣或多样化,我们在当下感觉时间过得越快。然而,在回顾这些经历时,由于记忆中事件的丰富性,我们会感觉那段时光非常漫长。反之,无聊的时光在当下很漫长,回顾起来却很短暂。 ☀️ 调谐昼夜节律的简单工具 要确保你的昼夜节律时钟准确,最有效的方法之一是醒来后一小时内,观看10到30分钟的强光(最好是阳光)。这能将你的内部时钟与外部光暗周期紧密同步,从而稳定你对时间间隔的感知。 🌐 播客信息补充 翻译克隆自:Time Perception, Memory & Focus | Huberman Lab Essentials 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了:OpenAI 年度盛会Dev Day上,C E O萨姆·奥特曼(Sam Altman)的重磅主题演讲。 本次演讲不仅回顾了OpenAI平台开发者数量和A P I调用量的惊人增长,更发布了一系列颠覆性的新工具和模型,旨在让A I的构建变得前所未有的简单和高效。萨姆·奥特曼详细介绍了Apps S D K,让开发者可以直接在ChatGPT内部构建交互式应用,触达数亿用户;随后推出的Agent Kit,则为构建、部署和优化A I Agent提供了全套解决方案,将Agent从概念带入实际生产。最令人兴奋的莫过于Codex的正式发布,这款由全新G P T 5 Codex模型驱动的软件工程Agent,能与开发者并肩工作,甚至在现场演示中,仅凭语音指令就将摄像头、Xbox手柄和灯光系统转化为可控软件,实现“不写一行代码创造软件”的奇迹。此外,我们还将听到G P T 5 Pro、更小巧高效的语音模型G P T Realtime Mini,以及功能强大的视频生成模型Sora 2的预览版及A P I,它不仅能生成高质量视频,更首次实现了声音与视觉的完美匹配。萨姆·奥特曼描绘了一个充满无限可能的新创造时代,任何有想法的人都能以前所未有的速度将创意变为现实。让我们一同走进这场关于A I未来的精彩对话。 👨⚕️ 本期嘉宾 Sam Altman,OpenAI C E O。 Alexi,ChatGPT 团队软件工程师。 Christina,Agent Kit 团队成员。 Ramon,OpenAI 软件工程师。 ⏱️ 时间戳 00:00 开场 & 播客简介 00:00 欢迎收听跨国串门计划 & 本期播客简介 02:23 萨姆·奥特曼致辞:回顾惊人增长与开发者贡献 03:30 Dev Day 核心:让 AI 构建变得前所未有的简单 ChatGPT 内部应用:Apps SDK 05:08 Apps SDK 发布:在 ChatGPT 内构建可交互应用,触达数亿用户 07:18 现场演示:Coursera 应用,实现边学边聊的沉浸式体验 10:00 现场演示:Canva 应用,从对话上下文生成海报与演示文稿 12:07 现场演示:Zillow 应用,基于对话查找、筛选房产并实时互动 16:07 Apps SDK 展望:应用目录、变现模式与开发者指南 Agent Kit:简化 Agent 构建与部署 17:15 Agent 时代:AI 从“问任何事”到“做任何事”的演进 19:04 Agent Kit 核心功能:Agent Builder、Chat Kit 和 Evals for Agents 20:06 案例分享:Albertsons 智能诊断销售问题,HubSpot 提升客户服务质量 22:21 现场演示:8分钟内构建并部署 Dev Day 网站专属 Agent 24:03 演示详解:Sessions Agent、Widget Builder 和 Dev Day Agent 的创建 26:14 演示详解:添加护栏(Guardrails)确保 Agent 可信赖性 27:50 演示详解:Agent 发布与 Chat Kit 在网站中的集成 Codex:软件工程的未来 31:02 AI 改变软件编写方式:人人都能成为创造者 32:47 Codex 正式发布 (GA) 与全新 GPT-5 Codex 模型 34:12 Codex 团队功能:Slack 集成、Codex SDK 与企业级管理工具 35:24 现场演示:“不写一行代码”创造软件的奇迹 37:08 演示详解:Codex 集成索尼 FR7 摄像机控制 39:30 演示详解:Xbox 无线手柄控制摄像头与实时语音 API 40:56 演示详解:Codex 连接场地灯光系统并实现语音控制 42:21 演示详解:通过语音指令实时重编程应用,生成演职员表 模型更新与新能力 45:09 GPT-5 Pro:OpenAI 迄今最智能模型,API 全面开放 45:59 GPT Realtime Mini:更小巧、高效且高保真的语音模型 46:52 Sora 2 预览版与 API:视频生成的可控性、声音与视觉完美匹配 47:34 Sora 2 案例:将现实元素融入视频、概念开发与美泰合作 49:54 总结:加速创造,AI 让一切皆有可能 🌟 精彩内容 💡 ChatGPT 内部应用:Apps SDK OpenAI 推出 Apps SDK,允许开发者直接在 ChatGPT 内部构建交互式应用。通过与 Coursera、Canva 和 Zillow 等应用的现场演示,展示了如何利用对话上下文,实现从学习、创作到生活服务的无缝集成,并触达数亿 ChatGPT 用户。 “我们希望 ChatGPT 能成为一个很好的工具,帮助人们取得进步,变得更高效、更有创造力,学得更快,在生活中更好地完成他们想做的任何事。” 🛠️ Agent Kit:将 Agent 从原型带到生产 Agent Kit 提供了一整套构建模块,包括可视化的 Agent Builder、可嵌入的 Chat Kit 和强大的评估工具 Evals for Agents。现场演示中,Christina 在8分钟内成功构建并部署了一个 Dev Day 网站专属 Agent,展示了 Agent Kit 如何简化 Agent 的设计、测试和部署流程,让 Agent 真正投入生产。 “我们的目标是,为每一位想要更快、更轻松地将想法变为 Agent 的构建者提供帮助。” 🚀 Codex:软件工程的“不写代码”奇迹 Codex 正式发布 (GA),并由全新的 GPT-5 Codex 模型驱动。Ramon 在现场展示了如何利用 Codex,仅凭语音指令,将舞台摄像头、Xbox 手柄和场地灯光系统转化为可控软件,甚至实时重编程应用,生成演职员表,全程无需手写一行代码。 “这是我所见过的软件创造方式上最重大的变革。” 💻 全新模型与多模态能力 OpenAI 发布了多项模型更新:迄今最智能的 GPT-5 Pro 模型全面开放 API;更小巧、高效且高保真的语音模型 GPT Realtime Mini;以及 Sora 2 预览版和 API。Sora 2 首次实现了视频生成中声音与视觉的完美匹配,并展示了其在可控性、现实元素融入和概念开发方面的强大能力。 “我个人认为,语音将成为人们与 A I 互动的主要方式之一,而这正是朝着这个现实迈出的一大步。” ❤️ AI 时代的创造力加速 萨姆·奥特曼总结道,AI 正在将软件创造的时间从数月甚至数年缩短到几分钟。任何有想法的人,无需庞大团队,都能以前所未有的速度将创意变为现实。OpenAI 致力于成为这个新创造时代的绝佳平台。 “你不需要一个庞大的团队,你只需要一个好点子,然后你就能以前所未有的速度将它变为现实。” 🌐 播客信息补充 翻译克隆自:OpenAI DevDay 2025: Opening Keynote with Sam Altman 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《Acquired》的深度内容,由两位资深科技投资人兼深度分析师 Ben Gilbert 和 David Rosenthal 共同主持。他们将带我们深入剖析科技巨头谷歌在人工智能领域的跌宕起伏,核心聚焦于其面临的“创新者的窘境”。节目从谷歌早期AI根基讲起,包括PageRank、Noam Shazeer的语言模型,以及Google Brain和DeepMind的创建。您将了解到AI教父Jeff Hinton如何推动深度学习,谷歌如何从CPU转向GPU,并自主研发TPU芯片,构建其独特的AI硬件优势。 播客详细讲述了Transformer论文的诞生及其作者们的离职,以及OpenAI在微软支持下,凭借ChatGPT的发布,如何给谷歌敲响了“红色警报”。面对这一生存威胁,谷歌迅速整合内部AI团队,推出多模态Gemini模型并加速迭代。同时,节目也回顾了Waymo自动驾驶项目二十年的漫长发展,以及谷歌云在AI时代的关键战略意义。Ben和David将深入分析谷歌在AI时代的看涨与看跌理由,剖析其在分发渠道、规模经济和品牌方面的独特优势,以及其在AI产品盈利模式上的挑战。这不仅是谷歌的AI史诗,更是对创新、竞争与自我颠覆的深刻反思。 ⏱️ 时间戳 00:00 开场 & 播客简介 谷歌的AI根基与早期探索 09:01 Larry Page的AI愿景:谷歌的终极形态 10:35 Noam Shazeer与语言模型的萌芽:从数据压缩到拼写纠错 15:52 Phil语言模型:AdSense背后的秘密武器 19:15 谷歌翻译的突破:Jeff Dean的并行化魔法 24:13 AI教父Jeff Hinton的登场:神经网络的异端学说 34:30 Google Brain的诞生:Andrew Ng与Jeff Dean的强强联手 38:58 “猫咪论文”的里程碑:无监督学习与YouTube推荐的基石 AI的“大爆炸”与谷歌的人才流失 44:10 AlexNet与GPU的崛起:英伟达的转折点 48:53 DNN Research的拍卖:谷歌、百度、微软、DeepMind的竞逐 53:29 DeepMind的传奇:从游戏到AGI的宏大愿景 01:00:18 DeepMind的融资困境:奇点峰会与Peter Thiel的投资 01:04:30 Elon Musk的介入:DeepMind与特斯拉的交集 01:08:31 Mark Zuckerberg的收购意向:Facebook AI Research的崛起 01:11:30 Larry Page的介入:谷歌收购DeepMind的幕后故事 01:14:15 Jeff Hinton的特殊待遇:包机尽职调查 01:16:16 DeepMind的整合与成果:数据中心降温与AlphaGo的胜利 01:20:07 OpenAI的诞生:Elon Musk与Sam Altman的“非营利”尝试 01:23:19 Ilya Sutskever的抉择:离开谷歌加入OpenAI 谷歌的硬件优势与Transformer的诞生 01:28:36 GPU的引入与TPU的自研:谷歌的AI硬件战略 01:33:46 TPU的秘密:降低计算精度与快速部署 01:39:17 TensorFlow的开源:谷歌的AI生态布局 01:43:45 Transformer论文的发表:谷歌大脑的划时代发明 01:45:57 Noam Shazeer的魔力:Transformer的优化与超越LSTM 01:47:21 “惨痛的教训”:数据与算力驱动的AI时代 01:50:17 Transformer作者的流失:谷歌的战略失误 OpenAI的崛起与谷歌的“红色警报” 01:51:03 Elon Musk与OpenAI的分裂:资金困境与战略转型 01:53:48 OpenAI的营利化与微软的投资:GPT时代的开启 01:59:01 GPT-2/3的迭代:AI能力的飞跃 02:00:51 GitHub Copilot的发布:AI产品化的里程碑 02:02:12 谷歌的停滞与市场质疑:创新者的窘境显现 02:03:16 谷歌内部的Meena与LaMDA:被雪藏的聊天机器人 02:07:57 ChatGPT的横空出世:OpenAI的“意外”消费级产品 02:11:35 Noam Shazeer的离开与回归:Character.ai的兴起 02:12:23 AI Test Kitchen:谷歌的谨慎尝试 02:14:25 微软必应的挑战:Satya Nadella的“让谷歌跳舞” 02:15:25 谷歌的“红色警报”:应对生存威胁的战略转变 02:18:56 Bard的仓促发布与失利:谷歌的阵痛 02:21:38 Google DeepMind的合并:AI团队的整合与统一模型 02:22:59 Mustafa Suleman的离职与Inflection AI:人才的流动 02:24:24 Gemini的诞生:谷歌的统一AI模型战略 Waymo的漫长征程 02:26:58 Waymo的起源:DARPA大挑战赛与Sebastian Thrun 02:29:09 斯坦福团队的创新:软件优先与多传感器融合 02:32:29 Waymo的成立:Larry Page的远见与Sebastian的转变 02:35:08 特斯拉收购案的擦肩而过:历史的偶然 02:35:59 Waymo的技术演进:从无深度学习到卷积神经网络 02:37:26 Waymo的商业化:独立子公司与巨额融资 02:38:32 Waymo的运营现状:凤凰城、旧金山的服务与未来拓展 02:40:23 Waymo的安全性:与人类司机相比的巨大优势 02:43:54 Waymo的市场潜力:交通运输的颠覆性机遇 谷歌的AI业务与未来展望 02:54:39 谷歌的垄断地位与AI竞赛:反垄断案的意外转折 02:57:09 谷歌的财务概况:巨额收入与现金储备 02:59:30 Gemini的商业化探索:Google One订阅与套餐策略 03:02:08 谷歌云的崛起:从PaaS到IaaS的转型 03:04:54 Thomas Kurian的领导:谷歌云的企业级战略 03:07:42 谷歌云的AI优势:TPU与全栈能力 03:11:23 看涨理由:分发渠道、全栈能力、规模经济、YouTube视频AI 03:16:23 TPU的成本优势:低成本生产Token的潜力 03:19:26 个性化数据与广告模式:AI变现的未来 03:21:42 看跌理由:AI产品形态与广告的适配性、市场份额竞争 03:23:44 现有企业的挑战:初创公司的竞争优势 03:25:20 谷歌AI的七种力量分析:规模经济、品牌、垄断资源 03:29:41 精髓:创新者的窘境与谷歌的求生之路 03:31:39 播客推荐与NFL创新峰会 03:33:26 个人推荐:F1电影、Travelpro行李箱、Glue Guys播客、Steam Deck游戏体验 03:40:39 感谢与结束 🌟 精彩内容 💡 创新者的窘境:谷歌的AI两难 节目以“创新者的窘境”开篇,深刻剖析谷歌如何在拥有垄断性搜索业务巨额利润的同时,面临自家实验室诞生的AI技术可能颠覆自身核心业务的困境。谷歌在AI领域拥有顶尖人才、模型、芯片和云基础设施,却因担心蚕食搜索收入而一度迟疑,最终在ChatGPT的冲击下被迫加速转型。 🛠️ 谷歌的AI全栈能力:从芯片到云 播客详细介绍了谷歌在AI硬件和基础设施上的独特优势。从早期Jeff Dean将谷歌翻译并行化,到Alex Krizhevsky推动GPU应用,再到Jeff Dean主导TPU芯片的自主研发,谷歌构建了从底层芯片(TPU)到超大规模云服务(Google Cloud)的全栈AI能力。这使其成为唯一一家同时拥有基础模型、自研AI芯片、云基础设施和规模化应用的公司,具备强大的成本和效率优势。 🚀 Transformer的诞生与人才流失 谷歌大脑团队在2017年发表的Transformer论文,奠定了现代大语言模型的基础。然而,谷歌未能充分认识到其颠覆性潜力,导致论文的八位作者几乎全部离职,其中多人创办或加入了OpenAI和Character.ai等竞争对手,成为谷歌在AI时代早期最大的战略失误之一。 🚨 ChatGPT的“红色警报”与谷歌的快速响应 ChatGPT的横空出世,给谷歌敲响了“红色警报”,迫使其迅速整合内部AI团队(Google Brain与DeepMind合并为Google DeepMind),并统一模型战略(Gemini)。尽管初期发布Bard遭遇挫折,但谷歌展现出惊人的执行力,在短时间内迭代模型,推出多模态Gemini,并在搜索产品中集成AI概览和AI模式,以“AI速度”应对挑战。 🚗 Waymo:20年的自动驾驶登月计划 节目回顾了Waymo(前Google自动驾驶项目Chauffeur)长达20年的发展历程。从DARPA挑战赛到成为Alphabet的独立子公司,Waymo坚持多传感器融合和软件优先的策略,最终在凤凰城、旧金山等地实现了无人驾驶商业化服务。Waymo在安全性上的显著提升,预示着其可能成为一个谷歌规模的颠覆性业务,改变全球交通运输格局。 💰 AI时代的商业模式之争 播客深入探讨了AI时代的商业模式挑战。传统搜索的广告模式利润丰厚,但AI聊天机器人直接提供答案可能减少广告展示。谷歌正探索结合Google One订阅服务和智能套餐经济学,以及在YouTube视频中实现AI驱动的即时购物。同时,作为低成本Token提供商,谷歌在AI基础设施上的优势可能使其成为未来AI服务的赢家。 🌐 播客信息补充 翻译克隆自:Google: The AI Company 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《Latent Space》的精彩一集,邀请到 Figma 的创始人兼 CEO Dylan Field 进行深度对话。Dylan Field 不仅是 Figma 这款革新性设计软件的掌舵人,更是一位拥有数学和计算机科学背景的科技远见者。在节目中,他与主持人Alessio深入探讨了 Figma 从最初的“拉近想象与现实的距离”这一使命,如何一步步拥抱 AI,从早期对机器学习和计算摄影的探索,到 GPT-3 带来的“顿悟时刻”,再到如今推出 AI 驱动的设计工具 Figma Make。Dylan 分享了 Figma Make 如何帮助用户将脑海中的想法迅速转化为可部署的产品,甚至让非技术人员也能轻松进行数据处理,无需编写代码。他展望了自然语言将成为未来设计核心交互界面的愿景,但强调这只是 AI 交互的“MS-DOS 时代”,未来将有更直观、更具创造力的探索方式。对话还触及了设计与代码之间日益模糊的界限,Figma Make 和 Code Connect 如何搭建桥梁,以及在 AI 时代,设计如何从“空白画布”的挑战中解放出来,成为更重要的差异化优势。Dylan 还对 AI 领域的“快时尚”趋势表达了审慎的乐观,并强调了在信息爆炸时代,发现那些比所有人快一步的“有远见的用户”的价值。这是一场关于创造力、技术演进与未来软件形态的深刻思考,不容错过。 👨⚕️ 本期嘉宾 Dylan Field,Figma 的创始人兼 CEO。他拥有数学和计算机科学背景,是 Figma 这款革新性设计软件的掌舵人。 ⏱️ 时间戳 00:00 开场 & 播客简介 Figma 与 AI 的演进 03:32 Figma 的 AI 觉醒:从早期探索到 GPT-3 顿悟 03:32 早期对机器学习和计算摄影的探索 06:10 Figma Make 的愿景:从想法到成品的最快路径 06:56 AI 在 Figma Design 中的未来应用 设计与代码的融合 11:21 自然语言:AI 交互的“MS-DOS 时代”与未来展望 13:16 “规格”的演变:设计与代码界限的模糊 14:09 AI 时代设计的重要性:差异化与竞争优势 15:33 Code Connect:设计与代码的桥梁 18:25 事实来源之争:代码与视觉界面的并行 19:10 视觉化隐喻的重要性:为更广泛人群赋能 AI 时代的创造力与挑战 20:45 解决“空白画布问题”:AI 降低设计门槛 22:17 Figma Make 与 Figma Design 的结合:从模拟器到驾驶舱 22:55 设计沟通的未来:AI 对设计变更的理解 25:37 AI 与美学:探索更广阔的设计空间而非强加风格 26:57 回顾 Flash 时代:AI 驱动设计风格的爆发与创新 28:25 潜空间牧羊人:AI 时代设计师的角色扩展 30:01 个人 Figma 库:美学参照与上下文知识库 AI 时代的创业与思考 31:58 软件“快时尚”:Dylan 对 AI 趋势的审慎乐观 33:05 团队协作与模式利用:AI 提升效率 34:33 软件的本质:从个人创造到可分享的工具 36:52 AI 与数据分析:信任、预测与可视化 37:49 软件与对话:AI 时代的界面思考 40:41 创业建议:不要轻易否定,寻找独特洞见 42:53 泰尔奖学金的启示:从梦想开始,而非从否定开始 44:36 X 算法与乐观主义:奖励争议与负面言论 45:49 Dylan 的 X 使用习惯:搜索反馈与寻找有远见的用户 48:34 早期招聘:耐心、长远与自律 51:39 Figma 招聘:聪明、上进、有产品意识的全栈工程师 技术之外的思考 53:18 Figma Make 的定位:与 prompt 工具的差异化 55:08 咖啡豆与特调拿铁:创造独特价值 55:18 数字稀缺性与富足性:NFT 与 AI 时代的收藏与社区 58:23 AI 领域的“快时尚”与“快速致富”思潮:警惕与反思 01:00:33 消费转创造:AI 赋能本地社区 🌟 精彩内容 💡 Figma 的 AI 觉醒与 Make 的愿景 Dylan 分享了 Figma 从早期对机器学习和计算摄影的探索,到 GPT-3 带来的“顿悟时刻”,如何一步步拥抱 AI。Figma Make 的核心愿景是让用户能以最快速度将想法转化为可上线的成品,甚至让非技术人员也能轻松进行数据处理,无需编写代码。 “我们真正想做的就是让你能以最快的速度,从脑子里的一个想法,变成一个可以实际上线的成品。” 🔗 设计与代码的模糊界限 在 AI 时代,设计与代码的界限日益模糊。Dylan 认为,自然语言是 AI 交互的“MS-DOS 时代”,未来将有更直观的交互方式。Figma Make 和 Code Connect 旨在搭建设计与代码之间的桥梁,让设计成为差异化优势,并强调在代码生成能力越强时,设计的重要性反而越高。 “代码生成能力越强,设计就越重要,那个推动设计的人也越重要。” 🎨 AI 时代的创造力与“空白画布” AI 有助于解决“空白画布问题”,降低设计门槛,让更多人参与创作。Figma Make 可以作为 Figma Design 的“飞行模拟器”,帮助用户入门,并在此基础上进行视觉操作和微调。Dylan 期待 AI 能帮助人们探索更广阔的美学空间,而非强加特定风格,从而推动设计风格的爆发与创新。 “第一个能挡住人的就是那张空白画布。所以,帮助人们从‘我有个想法’到真正在画布上画出点东西,这一步至关重要。” 🚀 AI 时代的创业与招聘 Dylan 对 AI 领域的“快时尚”趋势持审慎乐观态度,认为软件不会像一次性用品。他建议创业者要寻找独特的、反常规的洞见,并强调招聘需要长远眼光、自律和对流程的痴迷。对于 Figma 而言,他们寻找的是聪明、上进、有产品意识、关心设计、渴望学习新技能的全栈工程师。 “如果你要创业或者做一个产品,你通常需要有一个独特的见解,它通常应该是不受欢迎的。” 💎 数字稀缺性与社区的未来 Dylan 探讨了数字稀缺性(NFT)与 AI 时代富足性之间的悖论。他曾是 NFT 早期社区的参与者,但对后来“快速致富”的炒作氛围感到担忧。他希望 AI 能赋能更多小型本地社区,将消费行为转变为创造行为,而非仅仅追求盈利。 “我只是对那种‘快速致富’的氛围有点担心。” 🌐 播客信息补充 翻译克隆自:Taste is your moat — with Dylan Field, Figma 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《Huberman Lab》的深度对话,主持人Andrew Huberman与神经科学家Poppy Crum博士的精彩对谈。Andrew Huberman是斯坦福医学院的神经生物学教授,以分享科学工具改善日常生活而闻名。而Poppy Crum博士,作为斯坦福教授和杜比实验室前首席科学家,她的工作聚焦于技术如何加速神经可塑性、促进学习并丰富我们的生命体验。她拥有独特的“绝对音准”,能像看颜色一样“听到”世界,这种天赋塑造了她对感知的独特理解。 在这期节目中,Poppy博士深入探讨了我们大脑惊人的可塑性,以及智能手机、A I等技术如何持续重塑我们的神经系统,甚至改变大脑的感官地图。她分享了如何利用零成本的A I工具提升任何技能,从游戏训练中学习如何更快决策,到用计算机视觉分析优化游泳姿势。我们还将了解“数字孪生”的概念,它如何通过整合多源数据,为我们的健康、环境和学习提供实时洞察。更令人惊叹的是,Poppy博士揭示了A I如何通过分析我们的声音和生理信号,在早期发现神经退行性疾病、心理健康问题甚至身体状况。她还分享了蝙蝠与蛾子的“声学军备竞赛”,以及圆蛛如何将蜘蛛网调谐成探测器,以应对环境中的威胁。这期节目不仅带我们一窥科技与神经科学交织的未来,更提供了当下就能改善生活的实用工具和深刻见解。 👨⚕️ 本期嘉宾 Poppy Crum博士,神经科学家,斯坦福大学教授,杜比实验室前首席科学家。她的工作聚焦于技术如何加速神经可塑性、促进学习,并从整体上丰富我们的生命体验。她以其独特的“绝对音准”而闻名,能像看颜色一样“听到”世界,这种天赋深刻塑造了她对感知的独特理解和跨学科研究。 ⏱️ 时间戳 00:00 开场与嘉宾介绍 神经可塑性与技术重塑大脑 02:25 大脑可塑性:远超想象的自我改变潜力 06:04 “侏儒人”与感官地图:技术如何重塑我们的大脑表征 10:43 绝对音准:Poppy Crum博士的独特感知世界 17:59 智能手机与“有损压缩”:新一代的沟通方式与大脑适应 22:56 技术:好、坏还是中性?先验知识与期望塑造感知 28:51 神经连接的建立:技术如何改变大脑处理信息的方式 AI赋能学习与表现优化 35:18 AI与认知负荷:警惕技术取代认知技能 36:10 电子游戏与神经可塑性:提升对比敏感度和概率决策 39:27 体育训练中的AI应用:实时反馈提升表现 41:25 低成本AI工具:计算机视觉分析优化游泳姿势 44:25 AI在工作中的应用:洞察流程弱点 50:36 AI辅助学习:自我测试与发现弱点 53:22 AI的两种使用方式:提升认知 vs. 替代认知 数字孪生与情境智能 46:15 数字孪生概念:多源数据整合的实时洞察 49:58 数字孪生在日常生活中的应用:智能冰箱、学习辅助 01:06:03 智能环境:AI如何优化居家和车载体验 01:14:23 交通难题与自动驾驶:AI解决城市拥堵 01:15:58 非接触式传感器:通过环境数据理解人体状态 01:21:24 监管滞后:阻碍AI医疗应用普及 01:25:07 传感器整合:从可穿戴到环境感知 01:29:26 PAI:通过生物特征数据理解认知状态 01:31:07 表现量化与“游戏化”:激励自我提升 01:34:45 虚拟现实与健康应用:通过游戏进行压力控制 01:40:11 数字孪生的误解:它是“数字代表”,而非复制品 01:41:46 现实案例:空中交通管制、珊瑚缸生态系统、航班定价 01:46:02 AI与婴儿健康:通过声音识别潜在问题 b 02:12:51 神经可塑性的极限:紧迫性驱动改变 02:13:49 蝙蝠与蛾子的“声学军备竞赛”:确定性行为与声学伪装 02:19:10 奥利弗·萨克斯:通过想象动物感知提升共情 02:21:30 蜘蛛网的秘密:圆蛛调谐蛛网探测捕食者 02:26:45 蟋蟀与狨猴:双峰神经元与复杂社会交流 02:32:19 总结:人类行为优化与技术发展 02:33:08 总结与致谢 🌟 精彩内容 💡 大脑的无限可塑性 Poppy Crum博士强调,我们大脑的可塑性远超日常认知。从“侏儒人”的感官地图到城市噪音对听力阈值的影响,技术和环境无时无刻不在重塑我们的神经系统。她以自己独特的“绝对音准”为例,生动阐释了大脑如何对声音进行范畴知觉,并分享了她如何通过训练,在大脑中建立起两种不同音高的“绝对音准图谱”,实现自由切换。 “我的大脑会说,那是个A音,那是个B音,那是个G音,那是个升F音。” 🛠️ AI赋能学习与效率提升 节目深入探讨了AI在学习和技能提升方面的巨大潜力。Huberman教授分享了自己如何利用AI为论文内容设计测试,以对抗遗忘并找到学习弱点。Poppy Crum博士则介绍了如何使用零成本的AI工具(如Perplexity Labs和Replit)构建计算机视觉应用,实时分析和优化运动姿势,将精英级数据分析普及给大众。 “你不需要懂编程就能使用她构建的这个工具。任何人都可以用,而且你会发现它非常有用。” 🚀 数字孪生:理解与优化世界的工具 数字孪生并非科幻小说中的“数字复制品”,而是一种通过整合多源数据,提供实时洞察的“数字代表”。从空中交通管制到智能家居(如根据个人状态调整温度的HVAC系统),再到优化珊瑚缸生态系统,数字孪生正在改变我们理解和互动世界的方式。它能帮助我们识别模式、预测问题,并做出更明智的决策。 “数字孪生的目标不是要完整地数字化和呈现一个物理系统。它的目标是利用来自不同来源的可互操作的数据集,来获得洞察。” 🔬 AI在健康领域的革命性应用 AI通过分析我们的声音和生理信号,展现出在早期疾病诊断方面的惊人潜力。从言语模式预测自杀倾向和精神疾病,到声音中识别神经退行性疾病(如阿尔茨海默病)、糖尿病和心脏病的早期迹象,AI能够捕捉人类难以察觉的细微变化,实现更早期的干预和治疗。 “糖尿病、心脏病,都会在声音中显现出来……它会以某些,比如,在某些频段的调制波动形式出现。” 🦋 跨物种感知的奇妙世界 Poppy Crum博士分享了多个令人着迷的跨物种感知案例,揭示了生物如何利用独特的感官系统适应环境。包括蝙蝠与蛾子之间精妙的“声学军备竞赛”,蛾子通过随机飞行和身体反射来躲避蝙蝠的回声定位;以及圆蛛如何将蜘蛛网调谐成特定的共振频率,作为探测捕食者(如蝙蝠和鸟类)的“乐器”。 “这个特定的物种……有效地调整它的网……像小提琴一样调整它们的网来产生共鸣。” 🌐 播客信息补充 翻译克隆自:Enhance Your Learning Speed & Health Using Neuroscience Based Protocols | Dr. Poppy Crum 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了:播客《Lex Fridman Podcast》 本期对话的嘉宾是帕维尔·杜罗夫(Pavel Durov),即时通讯平台 Telegram 的创始人和 CEO。杜罗夫是数字时代最坚定的自由捍卫者之一。在这场长达四小时的深度对话中,他首次披露了自己在法国遭遇的“卡夫卡式”司法困境——因拒绝向政府妥协用户隐私,他被关押在无窗囚室长达四天。更令人震惊的是,他坦言曾因坚守原则遭遇投毒暗杀,在濒死体验后反而获得了更强大的精神力量。 杜罗夫分享了Telegram逆势盈利的商业密码:坚持不做用户数据挖掘的广告系统,仅靠订阅制和区块链技术实现盈利。同时,他还揭示了Telegram如何仅凭一个约40人的核心工程团队,实现对全球近十万台服务器的全自动化运维,并以惊人的速度碾压竞争对手推出新功能(如端到端加密、消息编辑、矢量动画贴纸等)。 对话深入探讨了杜罗夫斯多葛式的生活哲学:二十年不沾烟酒、每日进行数百次自重训练、不用智能手机的极简主义,以及如何通过冰水和桑拿磨练意志。这是一场关于自由、人性、高效工程和在巨大压力下保持正直的思想盛宴。 👨⚕️ 本期嘉宾 Pavel Durov,Telegram 的创始人和 CEO。他是一位连续创业者,以捍卫用户隐私和言论自由而闻名。他拥有 Telegram 100% 的股份,这使他能完全独立于股东和政府压力来运营公司。 ⏱️ 时间戳 00:00 开场 & 播客简介 自由与斯多葛哲学 05:10 自由的价值:从苏联到意大利的童年体验 06:17 自由的敌人:为什么自由比金钱更重要 06:44 对待死亡的态度:活在对死亡的恐惧中毫无意义 07:46 20 年不碰酒精:酒精如何麻痹脑细胞 09:11 如何对抗社交压力:解决根本问题,不要害怕与众不同 12:16 成功心法:找到细分领域并做到精通,与众不同 13:42 极简主义:为什么创始人不应该用智能手机 15:08 效率与专注:高效来自行动,而非休息 20:49 斯多葛式训练:每日 600 次自重训练与冰水澡 22:26 意志的磨练:俄式桑拿与长距离冷水游泳 27:31 清洁饮食:避免加工糖与间歇性禁食 29:00 避免药物:解决问题的根源,而非抑制后果 31:30 思想自由:警惕新闻和权力对情绪的操纵 33:15 拒绝色情片:投资于长期繁荣而非短期快乐 Telegram 的精益工程与隐私 34:17 极度精简:40 人的核心团队如何运维数万台服务器 35:45 自动化哲学:为什么人少反而更高效、更可靠 37:02 隐私设计:Telegram 员工和政府都无法访问私人消息 38:42 坚守原则:宁愿关闭市场,也不会交出用户数据 41:56 权力与审查:政府如何以牺牲个人为代价积累权力 46:21 卡夫卡式的审判:在法国被捕并拘留四天 面对压力与暗杀 51:51 荒谬的司法:预审法官制度与无休止的调查 54:50 拒绝后门:面对政府施压,杜罗夫的无畏回应 57:19 政治干预:法国情报部门试图施压审查罗马尼亚选举 01:03:46 欧洲的失败:过度监管如何扼杀创业精神 01:10:26 严格教育:数学作为逻辑思维的基础 01:15:20 教育中的竞争:消除竞争对社会产生的负面影响 01:19:46 哥哥的智慧:数学天才 Nikolai Durov 对 Pavel 的影响 01:22:59 VKontakte 的诞生:单人创始人如何构建俄罗斯版 Facebook 01:34:21 技术哲学:用 C/C++ 重写数据引擎追求极致速度 01:36:22 工程师的责任:低效代码造成的巨大时间浪费 01:41:32 招聘 A 级员工:用编程竞赛取代传统招聘 01:45:30 设计的艺术:矢量贴纸、移动渐变与“灭霸响指”动画 01:59:52 加密标准:Telegram 为什么选择可选的端到端加密 02:03:50 安全架构:Telegram 是唯一提供可复现构建的流行应用 02:07:12 斯诺登的教训:警惕政府推广的有缺陷的加密标准 02:16:48 首次公开:2018 年遭遇投毒暗杀的濒死体验 02:22:56 绝地反击:2011 年被武装警察上门与创建 Telegram 的决心 02:24:28 地缘政治:俄罗斯再次考虑禁止 Telegram 的后果 02:27:59 宣传战火:为什么 Telegram 受到各方攻击 02:34:32 领导力:如何看待 Elon Musk 的情绪化及其力量来源 商业模式与未来 02:38:19 逆势盈利:放弃 80% 收入潜力,拒绝数据挖掘广告 02:39:33 变现模式:Premium 订阅用户超 1500 万,年营收超 5 亿美金 02:44:48 TON 区块链:为 Telegram 的可扩展性而生 02:47:22 区块链应用:基于 TON 的用户名和收藏品(NFT 礼物) 02:52:06 比特币信仰:2013 年买入,预计将达到 100 万美元 02:54:30 哲学难题:次优选项困境的工程学解法 02:56:14 海象阴茎骨:背景中的象征性反抗与幽默 02:58:57 遗产规划:精子捐献与 100 多个生物学孩子 03:02:13 富足的悖论:老鼠天堂实验(宇宙 25 号)对人类社会的警告 03:06:39 父亲的教诲:以身作则与 AI 缺乏良知 03:09:41 思想的力量:通过专注改变概率景观 03:10:54 量子不朽:意识只能体验到我们存活的宇宙版本 03:12:53 结语 & Lex Fridman 播客收尾 03:13:08 Lex 深度解读:卡夫卡《审判》与 Pavel Durov 的现实困境 🌐 播客信息补充 翻译克隆自:Pavel Durov: Telegram, Freedom, Censorship, Money, Power & Human Nature | Lex Fridman Podcast #482 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客 YC 的《Light Cone》的深度探讨,主持人Gary、Hardge、Diana和Jared齐聚一堂,聚焦A I时代创业公司如何构建“护城河”。面对“ChatGPT套壳”的担忧,许多创业者困惑于如何打造不易被复制的持久优势。节目以Hamilton Helmer的《七大力量》理论为基础,重新解读了在2025年AI语境下这些经典护城河的全新应用。 节目核心观点是,早期创业者应优先关注“速度”和“解决真实痛点”,而非过早纠结于长期护城河。在此基础上,再逐步构建如卓越工程能力带来的“流程优势”、难以获取的“垄断性资源”(如私有数据或定制化模型)、让客户难以切换的“转换成本”(特别是AI Agent深入业务流程后的定制)、通过颠覆传统模式实现的“反向定位”、数据飞轮驱动的“网络效应”以及品牌影响力。这期节目不仅为AI创业者提供了宝贵的战略框架,更强调在瞬息万变的A I浪潮中,执行力与对用户需求的深刻理解,才是通往成功的基石。 👨⚕️ 本期嘉宾 本期播客 YC 主持 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00 开场 & 播客简介 AI时代创业者的护城河困境 02:03 AI时代创业者对护城河的担忧 03:02 《七大力量》理论背景与AI时代重塑 创业初期:速度与痛点优先 06:11 护城河是防御性,先有可守之物 06:20 早期创始人应先解决真实痛点 07:48 速度是唯一的早期护城河 08:13 大公司与创业公司的速度差异:Cursor的每日迭代 10:28 从零到一:先找到价值再谈守护 AI时代的“七大力量” 流程优势:卓越工程与复杂Agent 11:45 定义与AI应用:复杂AI Agent的构建 13:08 从Demo到可靠:最后10%的枯燥苦活 13:47 卓越工程能力与现有SaaS的防御 15:08 速度与执行力:最常出现的护城河 垄断性资源:数据、模型与政府合作 15:46 定义与经典案例 16:35 AI应用:政府合作与定制化数据 18:05 私有数据与模型微调:Character AI为例 19:10 上下文工程与早期AI解决方案的价值 转换成本:深度定制与个性化记忆 19:58 定义与经典SaaS案例 22:55 AI对传统转换成本的影响 23:20 AI时代的新型转换成本:Agent逻辑定制 24:18 消费级AI的个性化记忆 反向定位:颠覆传统模式 24:51 定义与AI时代的竞争格局 25:53 SaaS巨头定价模式的软肋与AI Agent的冲击 29:00 垂直SaaS AI:更大的钱包份额与价值创造 30:45 第二名优势与产品聚焦:Lara对比Harvey 32:59 AI的“超人”能力与品牌效应:Giga ML与Speak为例 34:33 ChatGPT与Google的品牌战:速度与颠覆 网络效应:数据飞轮与评估机制 35:57 定义与AI时代的数据驱动 37:19 用户数据训练模型:Cursor的案例 38:10 企业私有数据与“评估”(Evals)飞轮 规模经济:模型层与数据基础设施 39:19 定义与AI模型层应用 40:14 DeepSeek与模型训练成本的再思考 41:04 应用层案例:Exa的数据爬取与复用 总结:回归创业本质 43:09 速度是第一护城河,解决真实痛点是根本 🌟 精彩内容 💡 创业初期,速度与解决痛点是核心 播客强调,对于早期AI创业者,最重要的不是过早纠结于长期护城河,而是以最快的速度找到并解决用户真实的、迫切的痛点。大公司因其内部流程和组织架构,难以达到创业公司那样的迭代速度。 “唯一的护城河就是速度。” 🛠️ AI时代的“流程优势”与“垄断性资源” “流程优势”在AI时代体现为高度复杂且在真实世界中运行良好的AI Agent,例如为银行提供KYC或贷款审批服务的Agent,其可靠性需要大量耐心和枯燥的打磨,而非简单的Demo。 “垄断性资源”则包括与政府的深度合作(如Scale AI、Palantir),以及通过“前线部署工程师”模式获取客户的私有数据和定制化工作流,用于微调模型。 🔄 “转换成本”与“反向定位”的新维度 AI技术可能降低传统SaaS的数据迁移转换成本,但同时创造了新的转换成本:AI Agent的深度业务逻辑定制。对于消费级AI,个性化“记忆”也成为重要的转换成本。 “反向定位”在AI时代表现为AI原生公司对传统SaaS巨头的颠覆,特别是挑战其按席位收费的模式,以及垂直AI SaaS能够捕获远超传统SaaS的“钱包份额”。 🚀 数据驱动的“网络效应”与“规模经济” AI时代的“网络效应”主要体现在数据飞轮:用户越多,收集的数据越多,模型训练越好,产品价值越高。例如Cursor利用用户代码数据不断优化自动补全。 “规模经济”在AI领域主要体现在基础模型的训练成本上,但也有应用层面的体现,如Exa通过大规模网络爬取构建数据基础设施,实现成本优势。 ❤️ 创始人最核心的建议 不要被护城河理论束缚,而不敢开始。最关键的是找到一个特定人群的“痛点”,一个能够影响他们职业生涯甚至公司存亡的“生死攸关”的痛点,并着手解决它。从零到一的执行力,才是构建一切的基础。 “你最需要关注的,是那本书里甚至没有提到的第一道护城河,那就是速度。” 🌐 播客信息补充 翻译克隆自:The Most Powerful Moats for AI Startups 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《MAD Podcast》的特别节目,主持人是First Mark的Matt Turck,他与Anthropic顶尖AI研究员Sholto Douglas展开了深度对话。Sholto Douglas是一位经历独特的AI专家,他从澳大利亚的击剑世界冠军,到自学AI研究,再到Google和Anthropic的核心团队,一路见证并推动着AI的前沿发展。这次对话围绕Anthropic最新发布的Claude Sonnet 4.5模型展开,它被誉为全球最强的编程模型,在SWEbench基准测试上取得了78%的惊人成绩。Sholto揭示了AI进步的指数级加速,以及强化学习如何让AI学会“何时说我不知道”和自我纠正。最令人震撼的是,他们展示了一个AI智能体能自主工作长达三十小时,构建出一个功能完备的类Slack应用,这预示着AI在“计算机使用”和长期连贯性方面的巨大突破。Sholto坚信,当前的AI发展路径足以实现通用人工智能(AGI),并呼吁我们利用AI的巨大杠杆效应,解决人类面临的全球性挑战。这段对话不仅揭示了AI研究的幕后故事,更展望了我们即将迈入的、由AI驱动的全新世界。 👨⚕️ 本期嘉宾 Sholto Douglas,Anthropic的顶尖AI研究员。他是一位经历独特的AI专家,曾是澳大利亚击剑世界冠军,自学AI研究后加入Google,后成为Anthropic核心团队成员。他见证并推动着AI前沿发展,专注于AI对齐和经济影响领域。 ⏱️ 时间戳 00:00 开场 & 播客简介 02:11 AI进步的指数级加速:算力超级周期与技术迭代 03:26 嘉宾Sholto Douglas的独特经历 03:51 Anthropic模型发布节奏与技术加速 04:41 Sonnet、Opus、Haiku模型区分与Sonnet 4.5的突破 05:44 Sholto Douglas的个人成长与AI之路 05:58 击剑冠军与YouTube的启发 08:10 从机器人操控到Google AI 09:58 学术障碍与AI研究人才的多元化 12:05 AI研究人才库的增长与Anthropic的培养策略 12:29 Google的经历与Gemini项目的挑战 14:24 加入Anthropic:文化、目标与AI对齐 15:09 顶级AI实验室的差异:DeepMind与Anthropic的专注点 16:40 AI研究中的“品味”:理解机制与追求简洁 18:41 Richard Sutton的“惨痛教训”与通用方法的胜利 20:08 AI研究中的艺术与科学:数据与直觉的平衡 21:26 Anthropic实验失败率与“安全实验文化” 23:19 Anthropic的专注:编程与长期AI对齐 24:31 Anthropic为何专注于编程:自我研究与经济影响 25:49 编程作为AI突破口的优势:可处理性与可重复性 26:35 Claude Sonnet 4.5:全球最强编程智能体 26:49 SWEbench基准测试:Sonnet 4.5的惊人表现 28:30 模型好坏的真正标准:赋能用户做以前做不到的事 29:33 创业公司关键教训:押注模型未来能力 30:39 AI智能体自主工作30小时:构建类Slack应用 30:48 计算机使用与长期连贯性:AI的自我纠正能力 32:15 AI的两个维度:原始智能与持续运行能力 33:06 MetaEvals评测:衡量AI任务时间跨度的进步 33:54 30小时任务示例:可用的软件而非简单演示 35:33 技术飞跃的背后:记忆、上下文与自我纠正 36:49 突破的本质:持续努力与算力的函数 38:12 强化学习(RL)的影响:从预训练到习题反馈 41:10 测试时算力与强化学习的相互作用 42:06 为什么强化学习现在成为突破口:简单方法的有效性与模型质量门槛 44:33 强化学习与算力投入:推动AI进步的关键 44:56 AGI之路:大语言模型与强化学习的潜力 45:06 AGI的定义:比大多数人类在计算机任务上更出色 45:34 模型智力无上限:强化学习在数学与编程领域的应用 47:44 反方论点与Sholto的看法:Transformer与强化学习的潜力 49:17 指数级进步的现实:人们对AI加速的误解 50:25 Sonnet 4.5的通用性:经济学、研究与金融领域的表现 50:53 GDP评测:衡量AI对经济影响的重要指标 52:03 迎接AI驱动的未来:个体杠杆与全球挑战 53:00 机器人领域的进展:莫拉维克悖论的挑战与数据、反馈循环的突破 55:05 结束语 🌟 精彩内容 💡 AI进步的指数级加速与“算力超级周期” Sholto Douglas指出,AI技术进步正处于指数级加速阶段,尤其在算力供应增加后,今年是“算力超级周期”的真正开端。Anthropic模型发布的快速节奏,反映了预训练和强化学习双范式并行的成果,中档模型Sonnet甚至能超越之前的大模型Opus。 “任何我们能衡量的指标,似乎都在飞速进步。赌指数级增长就对了。” 🛠️ AI研究中的“品味”与“安全实验文化” 在AI研究领域,“品味”指的是从机理上理解目标、追求简洁,以及在信息不全时做出正确推断的能力。Anthropic等顶级实验室通过建立“安全的实验文化”,鼓励研究员自由探索,即使实验成本高昂,也相信长期投入能带来基础性技术突破。 “要从机理上理解你到底想做什么,并且要有一种追求简洁的偏好。” 🚀 Claude Sonnet 4.5:全球最强编程智能体 Sonnet 4.5在SWEbench基准测试上取得了78%的惊人成绩,被誉为全球最强编程模型。Sholto强调,模型的真正价值在于赋能用户做以前做不到的事情。最令人震撼的是,AI智能体能自主工作长达30小时,成功构建出一个功能完备的类Slack应用,这标志着AI在“计算机使用”和长期连贯性方面的巨大突破。 “当一个AI智能体被允许连续工作三十个小时,会发生什么?” 🧠 强化学习(RL)的突破与AGI之路 强化学习(RL)被视为AI进步的关键。它让模型学会了“何时说我不知道”和自我纠正,解决了幻觉问题。Sholto认为,大语言模型与强化学习的结合,足以实现通用人工智能(AGI),即在大多数面向计算机的任务上比大多数人类做得更好。他坚信模型没有智力上限,只要有正确的反馈循环和算力,就能在所有智力活动领域达到甚至超越人类顶尖水平。 “我认为这已经足够了。” 🌍 迎接AI驱动的未来:个体杠杆与全球挑战 Sholto呼吁人们为个体拥有更大杠杆能力的世界做好规划。AI将极大提升数字领域的个体生产力,未来一两年,一个人有望管理一个24/7工作的AI团队。他希望人们能利用AI带来的巨大杠杆效应,去解决全球面临的贫困、健康、住房等重要挑战,让世界变得更好。 “我希望的是,人们能利用模型最初带给我们的数字世界的杠杆,以及未来希望通过机器人带给我们的物理世界的杠杆,去极大地改善这个世界。” 🌐 播客信息补充 翻译克隆自:Sonnet 4.5 & the AI Plateau Myth — Sholto Douglas (Anthropic) 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了:知名播客《Latent Space》的精彩一集。 Instagram联合创始人、现任Anthropic首席产品官Mike Krieger深度探讨了Claude AI及其最新发布的Sonnet 4.5模型。他分享了作为CPO,如何将产品团队的洞察融入到模型研发的早期阶段,实现了产品与研究前所未有的紧密协作。Mike独家揭秘了他用于测试新模型的三项“感觉评估”:从创建Virtual Boy风格的3D射击游戏,到修改Claude Code代码库,再到制作任天堂的董事会演示文稿,这些充满趣味的例子生动展现了模型从最初的粗糙到如今的精细化演进。对话中,Mike还深入探讨了AI模型如何学习“UI品味”,以及Anthropic如何致力于让模型不仅能生成数据正确的Excel或PPT,更能产出符合设计美学的高质量内容。他预见了未来大部分用户界面将由AI动态生成,因此将产品感注入模型本身,使其具备良好的可用性和设计能力至关重要。此外,我们还将听到Anthropic平台从“Claude Code SDK”到“Claude Agent SDK”的战略转变,这预示着Claude将成为一个更通用的智能体框架,在编码之外的更广泛领域发挥作用。Mike强调,尽管模型自主运行时间很重要,但与用户的交互式规划和反馈才是构建信任、解决实际问题的关键。他更向听众发出邀请,希望大家积极分享Claude在解决难题时的表现,共同推动AI的进步。这期节目不仅是技术前沿的探索,更是对AI产品设计理念和未来发展方向的深刻洞察。 👨⚕️ 本期嘉宾 Mike Krieger,Instagram联合创始人,现任Anthropic首席产品官。 ⏱️ 时间戳 00:00 开场 & 播客简介 00:00 欢迎收听跨国串门计划 & 本期节目介绍 02:46 主播与嘉宾介绍 03:06 Sonnet 4.5 发布与产品研发 03:06 Sonnet 4.5 发布:内部测试与用户积极拥抱 04:16 产品与研究团队的紧密协作:从下游反馈到上游研发 05:47 模型发布前的产品部署与优化 06:12 Mike Krieger的“感觉评估” 06:12 CPO的三项必测项目:观察模型进化 06:20 必测一:Virtual Boy风格3D射击游戏 07:21 必测二:Claude Code代码库的特定修改 08:16 必测三:任天堂董事会演示文稿制作 08:45 AI与UI设计品味 08:45 注入产品感:模型输出质量与设计美学 09:35 解决“紫色网站”偏好:模型学习UI品味 10:22 产品负责人角色演变:将产品感注入模型本身 11:35 如何向模型解释“品味”:设计构建模块与视觉能力提升 13:04 模型在UI原型设计中的应用与探索 14:22 计算机视觉与传统UI交互:未来需要兼备的能力 15:51 Claude for Developers与平台战略 15:51 Claude for Developers:平台设计原则与构建模块 17:58 基准测试与客户痛点:真实问题驱动模型发展 19:57 规划能力与交互式智能体 19:57 规划能力提升:Cognition重写Devvin的案例 20:36 交互式规划:建立信任与解决知识型工作 21:40 自主运行时长与交互式反馈:信任与效率的平衡 23:26 Anthropic平台战略转型 23:26 从“Claude Code SDK”到“Claude Agent SDK”:通用智能体框架 24:25 Claude未来宇宙:AI、Code与Agent SDK的融合 25:09 统一构建模块:实现内部与外部的协同 25:56 Mike Krieger的呼吁 25:56 渴望用户反馈:模型在应对高难度挑战时的表现 26:41 邀请社区交流:分享Claude的优缺点,共同推动AI进步 27:18 Instagram的“Twitter客服”趣事与“做简单有效的事”哲学 🌟 精彩内容 💡 产品与研究的深度协同 Mike Krieger分享了Anthropic产品团队如何首次深度参与模型研发的上游,将客户反馈和实际应用洞察直接融入模型训练,解决了如模型“懒惰”等具体问题,实现了产品与研究前所未有的紧密协作。 “这次产品和研究的协同合作,是有史以来最紧密的一次,看到这个过程真的很有趣。” 🎨 AI模型的“UI品味”养成 Mike强调了让AI模型不仅能生成数据正确的内容,更要具备良好的设计美学。他透露Anthropic正在努力提升模型的“UI品味”,解决模型在UI设计上的偏好问题(如对紫色网站的偏爱),并预见未来大部分用户界面将由AI动态生成,因此模型自身的设计能力至关重要。 “我们尝试了更多地去教 Claude 关于‘U I 品味’的东西...它在上游就几乎承担了一种确保良好可用性与设计的责任。” 🚀 从Code SDK到Agent SDK的战略转型 Anthropic将“Claude Code SDK”更名为“Claude Agent SDK”,Mike解释这是因为用户已将其用作通用智能体框架。这一转变预示着Claude将成为一个更广泛、更通用的智能体平台,驱动Claude AI、Claude Code以及外部应用,所有产品都将基于同一套可组合的构建模块。 “它实际上是一个通用的智能体 S D K...同一套框架,可以在训练中使用,可以在 Claude Code 中使用,可以在 Claude A I 中使用,也可以被我们的客户使用。” 🤝 交互式规划与用户信任 Mike指出,尽管模型自主运行时间很重要,但对于大多数用例,与用户的交互式规划和反馈才是关键。模型应明确表达其计划,让用户能够提前提供反馈和互动,从而在模型和用户之间建立信任,尤其是在处理复杂知识型工作时。 “你需要先对你将要做的事情建立信心,然后你再去做...这种来回互动仍然很重要。” 👂 渴望社区反馈 Mike向工程师和听众发出邀请,希望大家积极分享Claude在应对高难度挑战时的具体表现(无论是做得好还是有待改进的地方),并愿意与Anthropic团队进行深入交流。他认为这种直接的用户反馈比基准测试更能准确把握模型的真实能力。 “我想对大家发出的呼吁是:无论是关于 Claude 做得好的地方,还是尤其关于它可以做得更好的地方,如果你们愿意花时间和我们聊聊,这对我们来说就是非常宝贵的用户研究。” 🌐 播客信息补充 翻译克隆自:⚡️Claude Sonnet 4.5 and Anthropic's roadmap for Agents and Developers — Mike Krieger, Anthropic 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期嘉宾是深受全球观众喜爱的喜剧演员、作家和主持人,特雷弗·诺亚(Trevor Noah)。在一场深度对话中,他坦诚分享了自己从南非种族隔离时期的“非法出生”,到登上《每日秀》舞台的艰难旅程。他揭示了童年时期家庭暴力的创伤,以及母亲被枪击的至暗时刻如何塑造了他对生命脆弱性的深刻理解。特雷弗首次公开了自己被诊断患有ADHD的经历,并阐释了未经治疗的ADHD如何表现为周期性抑郁和存在主义危机。他批判了当今社会对年轻男性的束缚,探讨了男性孤独感的根源,并分享了他通过社群、友谊和保持脆弱找到归属感的生存哲学。这是一场关于创伤、连接、目标感以及如何在充满噪声的世界中找到平衡的真诚对话。 👨⚕️ 本期嘉宾 Trevor Noah,南非喜剧演员、作家、电视主持人和政治评论家。他曾担任美国深夜新闻和讽刺节目《每日秀》(The Daily Show)的主持人长达七年。他的自传《天生有罪》(Born a Crime)登上《纽约时报》畅销书榜。 🌟 精彩内容 💡 发现自己的“蜘蛛感应” 特雷弗坦诚,在充满家暴的童年环境中,他练就了一种对危险的超敏感直觉,能够提前预知冲突的发生。他将这比作是孩子在寻求自我保护时发展出的“蜘蛛感应”。然而,这种超能力后来变成了诅咒,让他现在仍要在社交场合不断练习放低警惕,不去承担保护每个人的责任。 “你听到汽车的声音,就知道哪辆车会给家里带来危险。我能通过脚步声判断我继父是清醒还是喝醉了。我能通过他开门或关门的方式,知道自己该不该紧张。” 💔 离开《每日秀》的真正原因 尽管《每日秀》当时取得了巨大的数字成功,特雷弗认为“是时候了”。疫情期间,他意识到自己把生活完全变成了工作。他发现政治不是二元的,但如果在一个地方呆得太久,你会开始将那里视为全部现实。离开是为了专注于友谊、家庭和更广阔的世界。 “我问自己,Trevor,你想让它在哪里结束?对你来说,什么更重要?是这个节目和这个想法的收视率和成功,还是你的友谊和人际关系的收视率和成功?” 🧠 未经治疗的 ADHD 导致抑郁 特雷弗首次公开讨论他对 ADHD 的诊断,以及这种神经多样性如何导致周期性的存在主义抑郁。他的大脑会陷入“镜头变焦卡住”的循环,过度专注于生活的荒谬和毫无意义。他分享了对抗这种状态的实用方法,即在情绪失控时,先检查最基本的需求(睡眠、饮食、运动)。 “我当时没意识到,我所经历的抑郁,其实是源于未经治疗的 ADHD。我会卡在一个焦距上,然后就一直循环。我会想,这有什么意义?我们到底在做什么?” 🫂 男性孤独与“第三样东西”的障碍 特雷弗深入剖析年轻男性的孤独困境,认为这不是他们的错,而是一系列社会多米诺骨牌效应的结果。他指出,男性被传统文化限制,通常需要“第三样东西”(比如户外活动或游戏)作为中介才能进行有意义的连接,而女性则能直接分享。他认为,网络上的匿名社区(如 Reddit 或游戏)正在成为男性安全地表达脆弱的出口。 “我们男生不擅长这个。我前几天读到一篇很棒的文章,说男生们总是需要‘第三样东西’。总是有你,有我,还有那第三样东西。为什么我们不能就这样坐着,然后说,‘嘿,Steven,你心里在想什么?’” ✨ 艰难的幸存:金缮修复的哲学 在讨论是否能真正“克服”创伤时,特雷弗引用了日本的“金缮”(Kintsugi)修复艺术:用金色的黏合剂修复破碎的陶器。他认为,克服不是回到“完美破碎前”的状态,而是带着一种新的骄傲和美丽,去展示自己的裂痕。 “它是一种改变我思维定势的方式,让我思考克服或变得更好。它不是说,我们在某件事发生之前是完美的,而是说,我们得以带着一种新的骄傲和一种新的美丽,来展示我们的裂痕。” 🌐 播客信息补充 翻译克隆自:Trevor Noah: My Depression Was Linked To ADHD! Why I Left The Daily Show! 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 Tri Dao 是 Flash Attention 和 Mamba 的主要作者之一,是当今 AI 基础设施领域的关键人物。Flash Attention 技术是大幅降低模型推理成本的重要驱动力,而Mamba则代表了Transformer的替代架构的探索方向。他目前在Together公司担任首席科学家,同时也是普林斯顿大学的助理教授。 在本期播客中,Tri Dao深入探讨了AI硬件竞争的格局、下一代模型架构的演进,以及他如何利用AI工具将自己的编程效率提高了1.5倍。他分享了AI推理成本在过去三年暴降百倍的秘密,并预测了未来几年实现下一个十倍性能飞跃的方向。此外,他讨论了学术界与工业界在AI探索与应用中的不同角色,并提出了他认为最能影响未来AI发展方向的悬而未决的问题:如何让AI达到人类专家水平。 👨⚕️ 本期嘉宾 Tri Dao:Together首席科学家,普林斯顿大学助理教授。Flash Attention和Mamba的主要作者之一。 📒 文字版精华 见微信公众号(点击跳转) 🌟 精彩内容 🚀 推理成本暴降百倍:Flash Attention的洞察 Tri Dao回顾了过去三年AI推理成本下降至少一百倍的原因,核心在于解决了数据移动这个瓶颈。他以Flash Attention为例,解释了如何通过算法和硬件的协同设计,重新组织Attention计算,实现性能飞跃。他同时指出,GPT-4o等模型的成功应用了极端的4-bit量化,大大降低了内存需求。 🛠️ AI驱动的效率:1.5倍的生产力提升 Tri Dao坦承,他利用AI编程助手(主要是Claude Code和GPT-4o)的“智能体”能力,将自己的工作效率提高了约1.5倍。这些模型擅长编写复杂的GPU内核并提供宏观优化建议,使他能够专注于架构设计而非实现细节。 💡 架构的新方向:MOE的稀疏极限与Mamba的价值 尽管Transformer架构取得了巨大成功,但Tri Dao认为其达到AGI的成本可能是天文数字。他正在研究两条更高效的路径:一是将专家混合模型(MOE)进行极致的稀疏化,以提高每单位算力获取的智能;二是继续探索Mamba等状态空间模型(SSL),通过压缩历史状态(减少KV Cache)来优化大批量推理场景。 🎯 最大的悬而未决问题:如何实现专家级AI Tri Dao认为,当前LLM在互联网数据覆盖的领域(如前端编程)已达到人类平均水平,但真正的高经济价值任务集中在专家领域(如飞机设计师、医生)。这些领域知识并非基于海量互联网数据。未来最大的挑战和机遇在于,如何让AI掌握专业工具和深度知识,达到与人类专家协同工作的水平。 📈 推理市场的三大模式与智能体革命 随着工作负载多样化,Tri Dao预测推理市场将分化为三种模式:传统对话、极低延迟(Agentic/Interactive)和超高吞吐量(Batch/RL)。他相信,下一波应用浪潮将是智能体工作负载,这要求推理服务商不仅要优化GPU速度,还要解决模型如何安全高效地连接到外部数据库和人类工具的系统级挑战。 🌐 播客信息补充 翻译克隆自:Tri Dao: The End of Nvidia's Dominance, Why Inference Costs Fell & The Next 10X in Speed 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧