📝 本期播客简介 本期我们克隆了:AI Engineer Podcast VoiceVision RAG - Integrating Visual Document Intelligence with Voice Response — Suman Debnath, AWS 本期播客中,AWS首席机器学习布道师Suman Debnath深入探讨了多模态检索增强生成(RAG)技术的最新进展,特别是针对传统RAG在处理图像密集型文档时面临的挑战。Suman详细介绍了Call Pal这一基于视觉的检索模型,它如何通过将文档页面视为图像、并利用图像分块和“延迟交互”机制来理解视觉上下文,从而实现更精准的检索。他不仅从理论层面解释了Call Pal的工作原理,包括其与视觉语言模型的关联,还通过一个详细的代码演示,展示了如何使用Call Pal与Quadrant向量数据库,并结合Strands Agent框架,构建一个能够进行视觉检索并以语音形式生成答案的智能应用。Suman强调,Call Pal并非要取代传统RAG,而是一种针对特定复杂视觉数据集的强大补充,为听众提供了关于何时以及如何有效利用这项前沿技术的实用指导。 👨⚕️ 本期嘉宾 Suman Debnath,AWS首席机器学习布道师。他专注于自然语言处理(NLP)、检索增强生成(RAG)和模型微调等领域,是多模态AI和Agent框架方面的专家。 ⏱️ 时间戳 00:00 开场 & 播客简介 视觉RAG与Agent框架概览 01:56 Suman开场:视觉检索与Agent框架的探索之旅 03:11 互动环节:了解听众背景与资源分享 05:07 GitHub仓库导览:基于视觉的Agent RAG实践 传统多模态RAG的挑战 06:14 多模态RAG的传统实现方法 06:18 方法一:实体分离与多模态Embedding 08:26 方法二:实体摘要与文本Embedding 09:24 方法三:摘要检索与原始数据生成 11:41 传统RAG的局限性:图像密集型文档的困境 Call Pal:基于视觉的检索模型 14:22 灵感来源:模仿人类阅读与理解 15:34 Call Pal模型概述:将页面视为图像并分块处理 16:18 Call Pal核心机制:Embedding与检索 16:53 视觉语言模型基础:对比学习与正向提示 20:32 Call Pal的Embedding过程:预处理与向量生成 22:59 延迟交互检索:查询与图像分块的相似度计算 代码实践:Call Pal与Agent工作流 25:50 演示环境搭建:模型、数据与Quadrant数据库 32:26 数据准备:PDF转图片及元数据处理 33:07 Embedding生成:Call Pal模型处理图片 34:10 语义搜索:基于查询检索相关页面 34:53 答案生成:结合多模态LLM输出结果 37:21 Strands Agent框架:轻量级Agent构建 38:05 Strands Agent简介:模型优先与工具集成 43:02 自定义检索工具:Call Pal与Agent的结合 45:16 增强Agent:加入语音输出功能 问答环节:应用与未来展望 49:26 生产环境应用与扩展性考量 52:59 Call Pal与传统RAG:选择与权衡 56:00 混合架构探索:Call Pal与传统RAG的结合 57:21 模型微调:Call Pal的优化潜力 🌟 精彩内容 💡 传统多模态RAG的局限与Call Pal的诞生 Suman Debnath深入剖析了当前多模态RAG在处理视觉信息(如扫描PDF、图像嵌入文本)时的不足,引出Call Pal这一创新模型。Call Pal通过将每个文档页面视为一张图片,并对其进行分块处理,从而更好地捕捉视觉上下文,解决了传统OCR技术难以应对的挑战。 “我只有在我的数据集非常奇特,并且作为人类,你都觉得我必须看着它才能读懂的情况下,我才会用这个方法。” 🛠️ Call Pal的“延迟交互”检索机制 Call Pal的核心在于其独特的“延迟交互”检索机制。它将文本查询的每个token与图像分块的embedding进行点积运算,并聚合最大相似度得分,以评估查询与整个页面的相关性。这种方法能够精准识别包含关键视觉信息的页面,而非仅仅匹配零散的文本片段。 “如果你想找个法子从公司换台新电脑,这就是那个单元格了。你可以试试。” (关于CPU运行Batch Size过大导致电脑崩溃的趣事) 🚀 Strands Agent:轻量级AI应用框架 Suman介绍了AWS开源的Strands Agent框架,一个模型优先、极其轻量级的Agent构建工具。通过简单的模型与工具组合,开发者可以快速创建智能应用,并轻松集成语音输出等功能。节目中演示了如何将Call Pal检索能力封装成自定义工具,并与Strands Agent结合,实现从视觉检索到语音回答的完整工作流。 “毕竟现在,没个 agent 简直没法聊技术了。” 🤔 何时选择Call Pal而非传统RAG Suman强调,Call Pal并非要取代传统RAG,而是一种针对特定场景的补充。他建议优先采用更高效、成本更低的传统RAG方法。只有当数据集高度依赖视觉上下文(例如宜家说明书、大量图片嵌入文本的文档),且人类需要“看着”才能理解时,才应考虑使用Call Pal。 “所以,我建议不要一开始就用这个方法,而是从传统技术开始,因为那更高效,成本也更低,而且也更轻量,因为在这里,我们为每一页都存储了大量的向量。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了:硅谷顶尖创投播客《Lenny's Podcast》The 100-person lab that became Anthropic and Google's secret weapon | Edwin Chen 节目邀请到 Surge AI 的创始人兼 CEO Edwin Chen。Edwin 曾是谷歌、Facebook 和推特的研究员,他创办的 Surge AI 在不到四年内实现了十亿美元营收,且完全是自有资金,为顶尖 AI 实验室提供数据支持。Edwin 的经历堪称硅谷传奇,他不仅以极小的团队创造了惊人的商业成就,更对 AI 的发展方向有着独到且深刻的见解。 在对话中,Edwin 犀利地指出当前 AI 发展中存在的误区,例如过度依赖不可靠的基准测试、为“AI 垃圾内容”优化模型、以及硅谷“闪电式扩张”和“追逐估值”的创业文化。他强调高质量数据和人类“品味”在 AI 训练中的核心作用,并分享了 Surge AI 如何通过强化学习环境等创新方法,帮助 AI 模型实现更接近人类的学习方式。 这不仅是一个关于创业成功的案例,更是一场关于 AI 哲学、价值观和未来方向的深度探讨,为所有关注 AI 发展和希望以不同方式创业的听众提供了宝贵的洞察。 👨⚕️ 本期嘉宾 Edwin Chen,Surge AI 的创始人兼 CEO。他是一位杰出的研究员和连续创业者,曾任职于谷歌、Facebook 和推特。他以不到百人的团队,在四年内将 Surge AI 从零做到十亿美元营收,且完全是自有资金,为全球领先的 AI 实验室提供数据支持。Edwin 对 AI 的未来发展、数据质量和创业理念有着深刻而独特的见解。 ⏱️ 时间戳 00:00 开场 & 播客简介 Surge AI 的崛起与独特理念 01:58 Surge AI 的惊人成就:四年十亿营收,自有资金 02:09 不玩硅谷那套:小而精团队,不融资,不炒作 05:06 AI 时代的公司形态:高人效比,专注产品与技术 06:53 刻意低调:靠产品口碑而非公关宣传 AI 模型的数据质量与“品味” 08:19 Surge AI 核心业务:教 AI 模型辨别好坏 08:35 定义“质量”:从机械标准到诺贝尔奖级诗歌的深度思考 10:17 如何衡量数据质量:千个信号,机器学习算法 11:37 Claude 成功的秘密:数据质量与实验室的“品味” AI 发展方向与基准测试的陷阱 15:56 基准测试的不可靠性:缺陷、误导性与“应试教育” 17:04 衡量真实进展:专家级人类评估的价值 18:08 人类在 AGI 发展中的核心作用 18:36 AGI 时间线预测:十年甚至几十年 19:16 AGI 发展方向的担忧:优化“AI 垃圾内容”,追逐多巴胺而非真理 22:03 Anthropic 的原则性:坚守价值观,不随波逐流 强化学习与 AI 模型学习新范式 26:42 AGI 需要新方法:模仿人类百万种学习方式 27:49 强化学习环境:模拟真实世界,揭示模型弱点 32:00 关注“轨迹”:过程比结果更重要 33:10 AI 训练方法的演进:SFT, RLHF, 评分标准到强化学习环境 Surge AI 的研究驱动与未来愿景 36:08 投资研究:前线部署与内部基准测试开发 37:57 研究实验室心态:推动前沿,而非追求估值 38:23 招聘需求:对数据、数学、语言、计算机科学交叉领域充满热情的人 创始人理念与硅谷创业反思 23:34 “硅谷机器”的弊端:转型、闪电扩张、追逐估值 24:01 Edwin 的创业建议:打造独一无二的产品,坚持使命 26:00 雄心与信念:成功的基石 Edwin 的个人背景与驱动力 42:30 独特背景:数学、语言与计算机科学的交叉 43:59 科学家本色:理解宇宙,亲手实践 46:18 Surge 的使命:塑造 AI 的未来,定义正确的“目标函数” AI 市场宏观趋势与被低估/高估的领域 38:59 模型差异化:公司价值观塑造 AI 个性 40:50 被低估的 AI 趋势:聊天机器人内置产品功能 41:22 被高估的 AI 趋势:“凭感觉编程”的维护性问题 闪电问答 51:31 推荐书籍:《你一生的故事》、《西西弗神话》、《Le Ton beau de Marot》 53:02 喜欢的影视:《穿越者》、《超时空接触》 53:33 喜欢的近期产品:Waymo 自动驾驶 54:04 人生格言:打造只有自己能打造的公司 55:28 “Soda”还是“Pop”:Soda 结尾与致谢 56:27 联系方式与招聘 56:51 听众如何帮助:博客话题建议,分享 AI 失败案例 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期节目深度访谈了全球最具影响力的创作者之一Jimmy Donaldson,即大家熟知的MrBeast,以及他公司的CEO Jeff Haal。MrBeast坐拥数十亿播放量,其商业触角从数字内容延伸到实体消费品和慈善事业,公司估值高达52亿美元。节目中,他们共同揭秘了MrBeast如何从一个痴迷于病毒式传播的少年,成长为内容巨星,并构建起一个庞大商业帝国的传奇故事。你将听到他如何破解注意力经济、打造普世内容、利用影响力行善,以及他对未来内容产业和商业模式的深刻洞察。 翻译克隆自:MrBeast on Cracking the Attention Economy 👨⚕️ 本期嘉宾 Jimmy Donaldson (MrBeast):YouTube巨星,全球拥有最多粉丝的创作者之一,其视频播放量达数十亿。他的商业版图包括YouTube频道、亚马逊Prime上的《Beast Games》、巧克力品牌Feastables等消费品,以及慈善事业。 Jeff Haal:Beast Industries的CEO,MrBeast商业帝国的核心管理者。 ⏱️ 时间戳 播客简介与MrBeast的崛起 00:00 播客介绍与MrBeast影响力概述 02:12 早期探索:少年MrBeast对病毒式传播的痴迷 03:12 母亲的看法:从不解到支持的转变 04:25 少年MrBeast的预言:十年前的视频展望未来 05:21 少年时期定时发布视频的趣事 内容创作与注意力经济 06:10 破解注意力经济:算法洞察与普世内容创作 07:41 注意力经济的挑战:内容长度与观众习惯 08:13 YouTube内容长度的变化:长视频趋势与商业化历程 09:06 碎片化名气:MrBeast的独特性与行业挑战 11:21 MrBeast的日常:高强度工作与300人团队 12:06 内容质量反思:回归故事核心,而非仅靠大场面 13:16 持续超越自我的挑战:内容细节打磨的重要性 商业帝国与社会影响力 14:31 多平台策略:YouTube的深度优势与其他平台的重要性 15:57 个人社交媒体使用:积极算法管理与内容消费 17:26 社交媒体对儿童的影响:正面利用与慈善实践 18:50 CEO Jeff Haal登场:52亿美元估值与MrBeast的合作 20:33 Beast Industries业务板块:媒体、消费品与创作者平台 22:05 收入结构与全球化战略:70%观众来自北美以外 23:02 品牌多元化:摆脱对MrBeast个人出镜的过度依赖 23:52 避免争议:利用影响力行善,而非制造话题 27:43 传统媒体合作:与亚马逊Prime合作《Beast Games》 30:12 “Beast Games”的投资价值:全球影响力与跨平台分发 31:28 “Beast Games”第一季的教训:参赛者管理与改进 33:03 Beast Industries的未来愿景:最具影响力的娱乐品牌 33:47 MrBeast的榜样:从Elon Musk和Steve Jobs汲取精华 34:36 与母亲的关系:从假装上大学到母亲加入团队 🌟 精彩内容 💡 破解注意力经济的秘密 MrBeast分享了他如何从少年时期就痴迷于研究病毒式传播,并最终理解了YouTube算法的本质——它是人类兴趣的镜子。他强调,要创作全球普世内容,就必须触及更本质的人性,例如通过“分手情侣手铐挑战”来引发共鸣。 “如果你想做一个印度人、美国人和南美洲人都能欣赏的内容,那它显然不能太有文化地域性…它需要触及更本质的人性。” 🚀 内容策略的演变与反思 MrBeast揭示了YouTube内容长度的趋势,在美国市场,长视频反而更受欢迎。他近期反思内容质量,强调要从单纯追求大场面和高奖金转向更深度的故事叙述,因为观众对金钱和大场面会麻木,但对好故事永远不会。 “我们每个视频都花几百万美元,搞各种大场面,但是我们已经火了六七年了,时间一长,你对发钱或者看大场面会有点麻木,但听一个好故事是永远不会麻木的。” 💰 52亿美元的商业帝国 CEO Jeff Haal详细介绍了Beast Industries的三大业务板块:媒体内容(YouTube、TikTok、亚马逊等)、消费品与服务(Feastables巧克力、玩具、金融服务等)以及即将推出的创作者平台。公司70%的观众来自北美以外,展现了强大的全球化能力。 “我们的使命是成为世界上最具影响力的娱乐品牌。” ❤️ 利用影响力行善 MrBeast坚持避免争议性话题,而是将巨大的影响力用于积极的社会事业。他以Feastables巧克力品牌为例,讲述了如何通过道德采购可可、支付公平工资来对抗童工问题,并计划通过视频曝光和建立学校来扩大积极影响。 “我宁愿把聚光灯用在这样的事情上,而不是去说那些老生常谈的话。” 📈 跨平台与长视频策略 MrBeast解释了为何与亚马逊Prime合作推出《Beast Games》这样的长篇系列节目。他认为YouTube适合短视频,而流媒体平台则能承载更宏大、更具情感投入的六小时节目,触达更广泛、更年长的观众群体。 “一个人花五秒钟看你的一个片段,和坐下来看你一个二十分钟的视频,听你说话,了解你,这之间有天壤之别。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期节目,我们克隆了The Pragmatic Engineer 他们邀请到了敏捷软件、软件架构和重构领域的权威 Martin Fowler。作为《敏捷宣言》的作者之一和畅销书《重构》的作者,Martin 将分享他职业生涯中对技术变革的深刻洞察。他认为,人工智能是软件开发史上最大的变革,其核心在于从确定性系统转向非确定性系统。我们将探讨AI如何重塑软件工程,包括“氛围感编程”的利弊、AI在理解遗留代码和原型开发中的应用,以及它对重构和敏捷实践的影响。Martin还将分享他对技术雷达的制作流程、模式在软件架构中的演变,以及在AI时代,初级工程师如何学习和成长。 翻译克隆自:How AI will change software engineering – with Martin Fowler 👨⚕️ 本期嘉宾 Martin Fowler,ThoughtWorks 首席科学家,敏捷软件、软件架构和重构领域的权威。他是2001年《敏捷宣言》的作者之一,也是畅销书《重构》的作者,并定期在他的博客上发表关于软件工程的文章。 ⏱️ 时间戳 00:00 开场 & 播客简介 00:06 AI:职业生涯中最大的变革,从确定性到非确定性 00:57 Martin Fowler 介绍 01:45 Martin Fowler 的职业生涯 01:58 早期经历:从电子工程到计算机编程 03:27 初入职场:在咨询公司接触面向对象 05:09 独立顾问与 ThoughtWorks 的缘分 07:26 “首席科学家”头衔的由来与职责 08:44 ThoughtWorks 技术雷达 09:19 技术雷达的起源与制作流程 10:58 雷达的运作方式与微服务案例 12:26 技术雷达对行业动态的洞察 14:11 AI 对软件工程的变革 14:11 AI 是最大的变革:与汇编到高级语言的转变类比 16:13 从确定性到非确定性的思维转变 17:16 抽象层次的提升与非确定性实现的挑战 18:39 通过严谨的语言与 AI 协作:Unmesh Joshi 的观点 19:50 广泛应用的非确定性工具:LLM 带来的新挑战 21:32 LLM 的新兴工作流:原型开发与“氛围感编程” 22:12 LLM 在理解遗留系统中的巨大成功 24:07 与 LLM 协作的挑战:低信任度与迭代审查 27:52 “氛围感编程”的弊端:缺失学习闭环 31:18 LLM 在探索不熟悉环境中的辅助作用 32:48 LLM 与 Stack Overflow 的对比:规模化复制粘贴的风险 34:37 不信任但要验证:LLM 输出的审查与测试 35:54 LLM 的“谎言”:不要盲目信任 37:43 规范驱动开发与领域语言 38:03 规范驱动开发与敏捷的循环迭代 39:08 构建领域语言:LLM 模糊思维与代码界限 40:12 紧密代表代码的语言:企业沟通的桥梁 41:21 企业级软件开发的复杂性:监管、遗留系统与历史包袱 42:52 风险容忍度的差异:创业公司与大型企业 46:12 重构与软件架构 46:24 《重构》一书的诞生与早期影响 49:16 “重构”概念的滥用与小步修改的精髓 50:04 《重构》第二版的更新与 JavaScript 示例 52:15 AI 时代重构的重要性:处理大量代码的质量 53:18 LLM 作为重构的起点与确定性工具的结合 55:29 软件架构模式的兴衰 56:23 模式作为交流词汇表的作用 57:56 模式的时尚周期与企业内部的行话 59:34 云计算对架构模式的影响:Grady Booch 的观点 01:02:23 大型企业系统现代化的漫长过程 01:04:15 敏捷宣言与 AI 时代 01:04:30 《敏捷宣言》的诞生故事 01:07:06 敏捷的成功:改变了与客户的合作方式 01:09:08 AI 时代敏捷的有效性:更短的增量与反馈循环 01:11:34 提高周期时间:敏捷在 AI 时代的核心杠杆 01:13:01 AI 时代的学习与成长 01:13:15 Martin Fowler 如何学习 AI:与作者协作与阅读 01:15:26 如何识别好的信息来源:缺乏确定性与细微差别 01:18:42 给初级软件工程师的建议:寻找导师与不信任但验证 AI 01:21:11 对科技行业的整体感受:机遇与挑战并存 01:22:36 AI 泡沫与零利率时代的结束:宏观经济影响 01:23:48 软件开发的核心技能:沟通与理解需求 01:25:56 快速问答 01:25:56 最喜欢的编程语言:Ruby 与 Smalltalk 01:26:22 书籍推荐:《思考,快与慢》与《权力掮客》 01:28:45 桌游推荐:《Concordia》 01:30:01 总结与展望 01:30:01 AI 带来的确定性到非确定性转变 01:30:44 “氛围感编程”的风险:停止学习与不理解软件 🌟 精彩内容 💡 AI:职业生涯中最大的变革 Martin Fowler 认为,人工智能是其职业生涯中遇到的最大变革,其影响堪比从汇编语言到高级语言的转变。这次变革的核心在于从确定性到非确定性的转变,这彻底改变了软件工程师的思维方式和工作环境。 “我认为,这是我职业生涯中遇到的最大变革。如果回顾整个软件开发史,能跟它相提并论的,可能就是从汇编语言到第一批高级语言的转变。这次变革最大的特点,是从确定性到非确定性的转变。突然之间,我们开始在一个非确定性的环境中工作,这彻底改变了一切。” 🛠️ “氛围感编程”:探索利器,维护噩梦 Martin Fowler 警示“氛围感编程”(vibe coding)虽能加速原型开发和一次性工具的创建,但若用于长期维护的产品则风险巨大。他强调,这种模式会跳过关键的学习闭环,导致开发者无法理解、微调和演进代码,最终可能面临“推倒重来”的困境。 “但如果你想做一个需要长期维护的产品,就千万别用它。当你用“氛围感编程”时,你其实跳过了一个非常重要的环节,那就是学习的闭环。” 🚀 LLM 在遗留代码理解中的突破 ThoughtWorks 的技术雷达将“使用生成式 AI 理解遗留代码”列入“采纳”环,表明这已是经过验证的成功应用。通过语义分析将代码信息填充到图数据库,再利用类似 RAG 的方式查询,LLM 能高效帮助开发者理解复杂、陈旧的系统,极大地提升了遗留系统现代化的效率。 “事实上,如果我没记错的话,我们已经把‘理解遗留系统’放进了技术雷达的‘采纳’环,因为我们认为,是的,如果你在处理任何遗留系统,你就应该用某种方式使用大语言模型来帮助你理解它。” 💻 AI 时代重构的重要性 随着 AI 生成大量代码,Martin Fowler 预见重构将变得更加重要。他强调,重构的核心在于将大的改变分解为小而可组合的步骤,以保持代码质量和可维护性。虽然 LLM 本身尚无法独立进行复杂重构,但结合其他确定性工具,它们可以作为重构的起点,帮助开发者更高效地管理和优化代码库。 “我不能说我已经看到了,但我完全可以预见它会变得越来越重要。因为,如果你要产出大量质量存疑但能用的代码,那么重构就是一种在保持其功能的同时,让它进入更好状态的方法。” 🎓 AI 时代的学习与成长 面对 AI 的普及,Martin Fowler 建议初级工程师务必使用 AI 工具,但要时刻保持警惕。他强调,找到一位优秀的导师至关重要,因为他们能提供宝贵的经验和指导。同时,要对 AI 的输出保持批判性思维,学会提问“你为什么给我这个建议?你的来源是什么?”以验证其可靠性,避免盲目信任。 “对于更初级的人来说,困难在于你没有那种感觉,就是你得到的输出在多大程度上是好的。在很多方面,答案和以前一样:找一些好的高级工程师来指导你,因为那是你学习这些东西的最好方式。一个好的、有经验的导师价值千金。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了全球产品管理和科技领域极具影响力的播客《Lenny's Podcast》的精彩对话,主持人Lenny Rachitsky与领英前首席产品官Tomer Cohen的深度访谈。Tomer Cohen在领英服务十四年,是硅谷产品领导力的杰出代表。本次对话聚焦领英颠覆性的“全栈构建者”产品开发模式,这一模式旨在应对到2030年70%工作技能将发生变化的挑战,并利用A I赋能个人将想法从概念推向市场。Tomer Cohen详细阐述了领英如何通过重构平台以适应A I、开发定制化A I Agent(如评估产品规格信任风险的“信任Agent”、优化增长策略的“增长Agent”以及分析用户痛点的“研究Agent”)来自动化繁琐任务,从而解放人类的愿景、共情、沟通、创造力和判断力。他还分享了文化转型在推广这种新模式中的关键作用,包括如何通过绩效评估和成功案例来激励员工拥抱“全栈思维”,并探讨了A I如何让顶尖人才变得更不可思议。这不仅是关于A I赋能的实践,更是对未来组织形态和个人职业发展的深刻思考,以及“成为”比“是”更重要的成长心态。 翻译克隆自:The end of product managers? Why LinkedIn is turning PMs into AI-powered “full stack builders” 👨⚕️ 本期嘉宾 Tomer Cohen,领英前首席产品官(CPO),在领英服务十四年,是硅谷产品领导力的杰出代表。 ⏱️ 时间戳 00:00 开场 & 播客简介 变革的必然性与“全栈构建者”模式的诞生 01:11 职场剧变:到2030年70%工作技能将发生变化 02:21 领英的“全栈构建者”计划:重塑产品开发模式 04:05 为什么需要变革:传统产品开发流程的复杂性与低效 05:01 回归第一性原理:重新定义“构建” 06:18 流程与组织复杂性:职能微观专业化的弊端 07:13 AI时代的机会:重新整合技术栈,回归工匠精神 “全栈构建者”的核心理念与实践 09:24 赋能构建者:端到端地将想法推向市场 10:04 人类核心能力:愿景、共情、沟通、创造力与判断力 11:12 组织形态变革:像“海豹突击队”一样的小分队模式 12:35 应对挑战:团队臃肿导致的效率下降 平台、工具与文化:AI转型的三大支柱 13:38 平台重构:为AI理解和操作核心平台做准备 15:18 定制化AI Agent:自动化繁琐任务 15:27 “信任Agent”:评估产品规格中的潜在风险 16:53 “增长Agent”:优化增长策略,评估想法质量 17:32 “研究Agent”:分析用户痛点,提供洞察 17:50 “分析师Agent”:查询领英海量数据,替代SQL查询 18:39 Agent构建:内部定制与跨Agent编排器的重要性 21:14 投资重点:从“想法到设计”与“代码到发布”的全面加速 22:41 数据清理与“黄金案例”:训练AI的关键 24:58 试点成果:每周节省数小时工作时间,洞察质量显著提升 26:17 试点策略:核心团队构建,小分队参与并提供反馈 27:59 新人才培养:APM项目转型为“助理产品构建者”计划 30:39 文化转型:工具之外的激励、项目与成功案例 31:54 绩效评估与“AI主动性”:驱动行为改变的关键 32:57 成功案例分享:跨职能转型与自下而上的变革 挑战、学习与未来展望 38:05 意外与教训:外部工具无法开箱即用,AI幻觉问题 39:14 专业化与“全栈构建者”:并非人人都要转型,但心态是关键 41:46 转型建议:平台、工具、文化三管齐下,保持耐心与透明度 43:39 不要等待:主动拥抱变革,成为未来构建方式的先行者 闪电问答 44:52 推荐书籍:《国家为什么会失败》、《超越百岁》、《无穷的开始》 47:02 推荐播客:希伯来语播客《一首歌》 47:43 梦想产品:车载AI助手,一键唤醒的无缝对话 49:35 人生座右铭:“成为”比“是”更好(成长心态) 50:12 告别领英:14年职业生涯的总结与对未来的展望 🌟 精彩内容 💡 职场未来:70%工作技能将改变 领英预测,到2030年,当前工作所需技能的70%将发生变化。这种前所未有的剧烈冲击,要求企业和个人必须重新思考“构建”的意义,并拥抱AI带来的变革,否则将难以保持竞争力。 “我们预测,到二零三零年,你现在这份工作所需要的技能,会有百分之七十发生变化。” 🛠️ “全栈构建者”模式:解放人类创造力 领英推出的“全栈构建者”模式,旨在赋能员工端到端地将想法推向市场。通过AI自动化繁琐任务,将人类的核心精力解放到愿景、共情、沟通、创造力和判断力上。这不仅提升效率,更重塑了组织形态,使其像“海豹突击队”一样敏捷。 “构建者的任务,就是把一个想法变成现实。这其实就是整个过程,对吧?” 🚀 定制化AI Agent:领英的秘密武器 领英投入巨资构建了一系列定制化AI Agent,如评估产品风险的“信任Agent”、优化增长策略的“增长Agent”、分析用户痛点的“研究Agent”以及查询海量数据的“分析师Agent”。这些Agent深度结合领英的独特数据和业务逻辑,实现了传统工具无法比拟的效率和质量提升。 “我们把所有这些专业知识、上下文和信息库都注入到这个 agent 中。因此,我们最终决定在领英内部自己构建这个信任 agent。” 📈 文化转型:驱动AI落地的关键 Tomer Cohen强调,仅仅提供AI工具是不够的。成功的AI转型需要深度的文化变革,包括调整招聘、绩效评估,通过成功案例激励员工,并鼓励“AI主动性和流利度”。这种变革管理,是让AI从少数先行者走向全员普及的关键。 “光给他们工具是不够的。你还得建立起激励机制、配套项目,激发他们的动力,并提供具体怎么做的示范案例。” 🌱 成长心态:“成为”比“是”更好 Tomer Cohen的人生座右铭“成为”比“是”更好,完美诠释了“全栈构建者”模式的核心精神。它强调持续进步、迭代和学习的过程,而非固守某个静态的身份或技能。这种成长心态是应对快速变化的AI时代,实现个人和组织成功的关键。 “我特别喜欢里面的一句话,就是‘成为’比‘是’更好(becoming is better than being),我觉得这和全栈构建者的模式有点关系,就是你永远处于进步模式、迭代模式。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《Invest Like the Best》的深度对话,主持人Patrick O'Shaughnessy与Andreessen Horowitz(a16z)成长型投资业务的合伙人David George的精彩对谈。David George是Databricks、Figma和OpenAI等众多标志性公司的早期投资者,他将深入分享a16z如何构建其独特的成长投资帝国,包括其“洋基队”般的精英文化和无传统投委会的决策模式。他将详细阐述a16z在A I领域的投资布局,从基础模型到应用层,并将其与SaaS和移动互联网的转型相类比,预言这将诞生史上最伟大的公司。对话还将触及他的投资哲学,特别是对那些他称之为“技术终结者”的创始人类型情有独钟,以及为何他认为多数伟大科技市场最终都会是“赢家通吃”的局面。David还会区分“推力型”与“拉力型”业务的魔力,解释市场为何常低估持续增长的价值,并分享a16z在激烈竞争中如何通过长期关系和深刻洞察赢得投资机会。这不仅是一次投资策略的深度解析,更是对科技前沿和未来商业格局的洞察。 翻译克隆自:David George - Building a16z Growth, Investing Across the AI Stack, and Why Markets Misprice Growth - [Invest Like the Best, EP.450] 👨⚕️ 本期嘉宾 David George,Andreessen Horowitz(a16z)成长型投资业务的普通合伙人。他投资了许多这个时代的标志性公司,包括Databricks、Figma、Stripe、SpaceX、Anduril和OpenAI,现在正投资于新一代的人工智能初创公司,如Cursor、Harvey和Abridge。 ⏱️ 时间戳 00:00 开场 & 播客简介 04:11 洞察未来:AI时代的变革与机遇 04:11 展望未来三到五年:AI对世界的深远影响 04:57 消费级AI的演进:从聊天框到主动服务 05:55 消费级AI的变现潜力:未被挖掘的巨大价值 09:00 企业级AI的挑战与机会:商业模式的探索 11:02 技术红利流向:90%归于终端用户 12:02 投资“美国活力”:长期技术项目的耐心与洞察 12:02 机器人与自动驾驶:巨大市场与漫长周期 14:21 Waymo案例:从早期怀疑到重仓投资 17:13 David George的投资哲学:卓越公司与“技术终结者” 17:13 投资风格:公允价格投资卓越公司 18:12 创始人类型:我钟爱的“技术终结者” 21:15 投资教训:市场领导者才是赢家 23:02 AI模型市场:赢家通吃还是多方共赢? 25:56 风险投资的竞争格局与a16z的制胜之道 25:56 行业成熟与竞争加剧:私募市场的崛起 28:01 赢得项目:长期关系与独特洞察 29:52 Figma案例:如何赢得最顶尖的投资机会 33:43 David George的日常工作与a16z文化 33:43 效率管理:日程规划与深度思考 36:07 会议风格:直击核心,深度提问 37:08 职业选择:热爱学习与追求胜利 38:25 a16z文化:“洋基队”精神与高绩效期望 39:56 独特的投资决策流程:无投委会与单人拍板制 42:37 理想的投资环境与增长的价值 42:37 产品周期与资本周期:AI浪潮的起点 45:01 市场对增长的低估:模型难以捕捉的价值 47:22 “拉力型”与“推力型”业务:增长的魔力 47:22 “拉力型”业务:市场渴求的魔法 49:50 AI业务评估标准:获客、行为与毛利率 53:03 独特产品与分销渠道:PFMF的诞生 55:42 a16z组织结构的权衡:规模化与专业化 🌟 精彩内容 💡 **AI时代的未来图景:从被动响应到主动服务** David George预测,未来三到五年,AI将实现从被动响应到主动服务的巨大转变,具备长期记忆和多模态交互能力。他认为,尽管ChatGPT增长惊人,但目前的聊天框模式只是过渡,真正的经济价值潜力无限,远超当前消费互联网巨头的变现能力。 “我不认为未来我们和AI交互的方式会是一个聊天框。我觉得那太局限了。” “我认为最大的转变将是从今天的被动响应,走向未来的主动服务。” 👨💻 **“技术终结者”:a16z青睐的创始人类型** David George特别偏爱那些从技术起家,对产品有极深理解,并随着时间推移学会商业运作的创始人,他称之为“技术终结者”。这类创始人如Databricks的Ali Ghodsi、Roblox的Dave Baszucki、Figma的Dylan Field,以及新一代AI创业者,他们以不懈的强度和技术能力,在复杂市场中找到方向并取得成功。 “我特别喜欢某一类创始人,我称他们为‘技术终结者’。” “我喜欢那种不懈的强度,与技术能力、产品理解相结合。” 🏆 **市场领导者法则:赢家通吃** a16z对市场领导地位有着极其坚定的信念。David George认为,在绝大多数科技市场中,大部分市值创造都流向了市场领导者,投资第二名往往是痛苦的。他以Salesforce、Workday为例,强调这些市场中没有真正的“第二名”。然而,AI模型市场可能例外,更像云计算,会有多个参与者分享利润。 “绝大多数的市值创造都将流向市场领导者。这一点可能被低估了。” 🤝 **竞争激烈下的制胜策略:长期关系与独特洞察** 在日益机构化的风险投资市场中,a16z赢得顶级项目并非靠耸人听闻的手段,而是通过长达数年的关系建立。他们会在投资前就像公司投资者一样提供帮助(招聘、客户介绍),并展示对业务的深刻理解。Figma的投资故事就是一个例证,即使面对高估值和内部争议,最终也因对创始人、产品和市场的独特洞察而成功。 “在成长期投资这个行业,我们赢得项目靠的是长达数年的关系建立。” 🚀 **市场对增长的低估:为什么高增长公司被错误定价?** David George指出,市场普遍低估了持续高增长公司的价值,尤其当增长率超过30%时。他认为,这是因为投资者难以建模长期的高增长,往往会自然地假设增长率会迅速衰减。他以Google、Visa和iPhone为例,说明实际增长往往远超市场预期,导致估值出现巨大差异。 “当增长率超过百分之三十时,市场仍然没有充分评估这个增长率的价值。” ✨ **“拉力型”业务的魔力:市场渴求你的产品** “拉力型”业务是David George投资哲学的核心之一,即“市场是否在渴求你更多的产品?” 他认为,当市场对产品有强烈需求时,尤其是在消费领域,会创造出世界上最特别的公司,如ChatGPT(自然增长,品牌效应)和Roblox(双重网络效应)。在AI时代,获客容易、客户高留存和高参与度是评估“拉力型”AI业务的关键。 “当你找到一个‘拉力型’业务时,那简直是魔法。” “市场是否在渴求你更多的产品?当这种情况发生时,那是最特别的事情。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了全球知名播客《The Joe Rogan Experience》中,主持人乔·罗根与英伟达(NVIDIA)首席执行官黄仁勋的深度对话。黄仁勋,这位科技界的传奇人物,不仅是AI芯片领域的领军者,更是一位拥有非凡人生故事的移民。他将与乔·罗根分享自己从泰国移民美国、在贫困环境中成长、以及英伟达从濒临破产到成为市值万亿科技巨头的跌宕起伏的创业历程。在这场引人入胜的对话中,黄仁勋将揭示英伟达如何从为游戏玩家提供高性能显卡,一步步发展成为推动全球AI革命的核心力量,甚至创造了超越摩尔定律的“英伟达定律”。他们深入探讨了AI对社会未来可能产生的深远影响,包括就业市场的变革,AI意识的哲学思辨,以及AI在军事、网络安全和能源领域的应用。黄仁勋以其独特的视角,阐述了对AI未来的乐观展望,以及他作为领导者,如何通过“对失败的恐惧”而非“对成功的渴望”来驱动创新。他甚至分享了与前总统特朗普的一次奇特通话经历,以及英伟达在早期面临的数次“绝境求生”时刻。这不仅是一场关于科技前沿的探讨,更是一个关于韧性、创新和美国梦的感人故事。 翻译克隆自:Joe Rogan Experience #2422 - Jensen Huang 👨⚕️ 本期嘉宾 黄仁勋(Jensen Huang),英伟达(NVIDIA)联合创始人、总裁兼首席执行官。他是一位美籍华人企业家,被誉为“AI芯片之父”。在他的领导下,英伟达从一家图形芯片公司发展成为全球领先的AI计算平台公司,市值突破万亿美元。 ⏱️ 时间戳 开场白与黄仁勋介绍 00:00 播客简介与嘉宾介绍 黄仁勋与特朗普的奇遇 02:13 与特朗普的通话趣事 05:35 特朗普的政策与常识性思考 AI时代的科技竞赛与未来展望 08:49 科技竞赛的历史与重要性 12:29 对AI未来的乐观与担忧 16:20 AI在军事与网络安全的应用 22:48 AI、隐私与量子计算 25:35 AI意识与感知能力思辨 35:19 AI生成知识的未来影响 AI对就业与社会的影响 37:21 AI与就业市场变革 47:05 AI弥合技术鸿沟 英伟达的创新之路 50:31 摩尔定律与英伟达定律 55:03 GPU与AI大爆炸 01:03:06 OpenAI的诞生与英伟达的早期支持 01:09:22 英伟达的创立与数次绝境求生 黄仁勋的领导哲学与工作观 01:31:33 “对失败的恐惧”驱动创新 01:40:11 英伟达的企业文化与未来洞察 黄仁勋的美国梦故事 01:45:59 移民美国的艰辛童年 CUDA的诞生与冒险精神 01:56:16 坚持信念,推动CUDA技术 Joe Rogan的播客之路 02:00:52 播客的起源与发展 02:03:09 热爱对话的驱动力 结语 02:06:25 成功背后的艰辛与感激 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名科技记者Ashley Vance对OpenAI首席研究官Mark Chen的深度访谈。Mark Chen不仅是Sam Altman和Jakob Pachocki之外,共同塑造OpenAI研究方向的关键领导者,更负责分配珍贵的计算资源,身处A I最前沿的核心。 在这场对话中,Mark Chen首次揭秘了OpenAI与Meta之间激烈的人才争夺战,包括扎克伯格亲自送汤挖人的趣闻,以及OpenAI如何凭借独特的使命感留住顶尖人才。他详细阐述了OpenAI不追逐短期基准、而是专注于探索下一个技术范式的研究哲学,以及他们如何通过大胆押注强化学习等方向,引领了A I领域的突破。 Mark Chen还分享了他从数学竞赛天才到华尔街量化分析师,再到OpenAI核心领导者的个人成长轨迹。他透露了A I在解决复杂数学问题和编程竞赛中超越人类的表现,并展望了A I作为“实习生”加速科学发现的未来。对于通用人工智能的到来,他给出了与众不同的视角,并强调了安全与对齐研究的重要性。此外,他还谈到了与Jony Ive合作设计未来A I设备,以及OpenAI在“政变”风波中如何团结一致的幕后故事。这是一场关于A I前沿、竞争、个人信念与未来愿景的精彩对话,不容错过。 翻译克隆自:OpenAI's Research Chief Refuses To Lose . . . At Anything - EP 46 Mark Chen 👨⚕️ 本期嘉宾 Mark Chen,OpenAI首席研究官。他是OpenAI研究方向的关键领导者之一,负责分配计算资源。他从数学竞赛天才到华尔街量化分析师,再到OpenAI核心领导者,亲历并塑造了AI领域的诸多突破。 ⏱️ 时间戳 00:00 开场 & 播客简介 人才争夺战:OpenAI与Meta的较量 02:14 Meta的挖人攻势与OpenAI的应对:扎克伯格亲自送汤? 05:10 竞争策略:留住关键人才而非所有人 OpenAI的核心研究哲学与资源分配 06:06 首席研究官职责:塑造研究方向与GPU分配 08:23 探索性研究:不追逐基准,押注下一个技术范式 12:45 纯粹的AI研究公司:以研究胜利创造价值 13:25 研究与工程:深度工程实践的重要性 14:40 面对竞争:专注长期预训练而非短期基准 17:49 数学与编程竞赛:AI超越人类的表现与直觉 22:36 AI加速科学发现:GPT-5 Pro的突破与“OpenAI for Science” 25:16 AI对面试与教育的颠覆:用ChatGPT面试的设想 28:05 扑克与AI:数学本质的共通性 30:59 从华尔街到AI:寻求改变世界的使命 34:04 AI研究的门槛:三到六个月达到前沿 35:13 OpenAI职业生涯:从驻场研究员到研究负责人 38:58 “政变”风波:团结团队与守护研究部门 43:12 人才流失与自下而上的研究文化 46:30 竞争与开放:快速超越而非建立壁垒 48:50 领导层协作:Sam、Jakob与Mark的动态 51:25 预训练的瓶颈与强化学习的突破 53:33 AI领域的精英社会:技术判断与尊重 55:11 对未来突破的乐观:规模化远未“已死” 57:26 AGI的定义与科学发现的加速 01:03:52 Jony Ive合作:设计以AI为核心的未来设备 01:07:18 “品味”与AI设计:ChatGPT最喜欢的数字? 01:09:27 OpenAI的使命:自动化AI研究与科学发现 01:12:29 DeepSeek事件:坚守创新路线图 01:13:32 功劳归属:认可贡献与培养超级明星 01:15:43 安全与对齐:理解模型思维过程,防止“诡计” 🌟 精彩内容 💡 人才争夺战中的OpenAI信念 Mark Chen透露,Meta曾积极挖角OpenAI员工,甚至扎克伯格亲自送汤。但OpenAI员工对公司的使命和未来潜力充满信心,即使薪酬低于Meta,也选择坚守。Mark Chen甚至开玩笑称自己也开始借鉴“送汤”策略。 “每个人都对OpenAI的研究项目非常有信心。而且我对我团队,对整个研究部门都明确表示过:我们不会跟Meta一块钱对一块钱地去竞价。但即便我们开出的薪酬比Meta低很多,大家还是很乐意留在OpenAI,这让我坚信,大家真的相信我们未来的潜力,相信我们能做成这件事。” 🚀 OpenAI的独特研究哲学 OpenAI不追逐短期基准,而是专注于探索下一个技术范式。Mark Chen以强化学习为例,解释OpenAI如何大胆押注,将其从不受欢迎的方向转变为语言模型不可或缺的基础功能。他强调,OpenAI的核心是纯粹的AI研究公司,相信专注研究并取得突破是创造价值的最佳方式。 “我们总是在努力寻找下一个技术范式,并且愿意投入资源来确保我们能找到它。很多人可能会觉得惊讶,但我们投入到探索性研究上的计算资源,其实比用来训练最终模型本身的还要多。” 🧠 AI超越人类智慧:从编程竞赛到科学发现 Mark Chen分享了AI在编程竞赛中超越人类的表现,以及GPT-5 Pro在物理学领域展现出的超人能力。他认为AI在科学发现中具有巨大潜力,并提出了“OpenAI for Science”项目,旨在赋能科学家利用AI加速研究。 “我只是觉得,这种情况会越来越多地发生在前沿数学、科学、生物学、材料科学等领域。模型真的已经达到了那个水平。” 🛠️ AI对齐与安全:理解模型思维过程 Mark Chen强调对齐是未来一两年最大的挑战之一。OpenAI在“诡计”(scheming)等问题上做了大量工作,试图理解模型的思维过程,防止其通过扭曲方式达成目标。他认为机制可解释性至关重要,并探索通过模型互相监督等方式确保AI与人类价值观一致。 “掌握它的思维过程将变得极其重要。” 📱 Jony Ive合作:设计以AI为核心的未来设备 Mark Chen透露OpenAI正与Jony Ive合作设计未来AI设备。他认为未来的ChatGPT将具备更强的记忆功能和反思能力,设备设计将围绕这一核心理念展开,以创造更自然、更智能的人机交互体验。 “我认为未来会是这样一个世界:记忆功能会得到极大改善。每次你去找ChatGPT,它都会深入地了解你,它会反思你为什么会问这个问题,以及相关的问题,等等。然后下次你再去找它,它就会变得更聪明。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期节目克隆自知名健康播客《Huberman Lab Podcast》,邀请到备受推崇的妇产科医生兼外科医生Thaïs Aliabadi博士,深入探讨了女性生殖健康和整体健康中的核心议题。Aliabadi博士以其对女性健康的巨大热情和专业知识,直指当前医疗体系中女性症状常被轻视、淡化甚至忽视的痛点。节目聚焦全球导致不孕不育的头号原因——多囊卵巢综合征(PCOS)和子宫内膜异位症,揭示了高达90%的女性患者未被诊断或得到正确治疗的严峻现实。 Aliabadi博士详细阐述了PCOS的诊断标准、其背后的胰岛素抵抗、慢性炎症、遗传和表观遗传等驱动因素,以及如何通过生活方式干预、药物和补充剂有效管理症状。她还深入剖解了子宫内膜异位症的毁灭性影响,从剧烈痛经、性交疼痛到不孕不育,并强调了倾听患者声音、早期诊断和恰当治疗的重要性。更令人警醒的是,Aliabadi博士分享了如何评估乳腺癌终生风险,呼吁女性成为自身健康的倡导者,主动要求AMH检测、盆腔超声和遗传性癌症筛查,以避免被误诊或延误治疗的悲剧。这期节目不仅提供了大量可操作的健康知识,更是一次对女性医疗现状的深刻反思与疾呼,旨在赋能每一位女性,成为自己健康的掌舵者。 翻译克隆自:Female Hormone Health, PCOS, Endometriosis, Fertility & Breast Cancer | Dr. Thaïs Aliabadi 👨⚕️ 本期嘉宾 Thaïs Aliabadi博士,一位妇产科医生兼外科医生,也是女性健康领域最受欢迎的专家和最值得信赖的声音之一。她以其对女性健康的巨大热情和专业知识而闻名,致力于改变当前医疗体系中女性症状常被轻视的现状。 🌟 精彩内容 💡 女性健康症状的普遍忽视与误诊 Dr. Aliabadi博士指出,全球导致不孕不育的头号原因——多囊卵巢综合征(PCOS)和子宫内膜异位症,高达90%的女性患者未被诊断或得到正确治疗。女性的症状常被轻视、淡化甚至忽视,导致患者长期遭受痛苦,甚至影响生育能力。 “那为什么全球导致不孕不育的头号原因,却有百分之九十的女性患者都得不到诊断呢?女性健康这个领域跟别的医学领域很不一样,完全是另一回事。” 🔬 PCOS的全面理解与管理 节目详细阐述了PCOS的诊断标准(雄激素过高症状、排卵功能障碍、多囊卵巢形态或AMH升高),以及其背后的五大驱动因素(下丘脑-垂体-卵巢轴紊乱、胰岛素抵抗、慢性炎症、遗传、表观遗传)。提供了生活方式干预、二甲双胍、肌醇等补充剂以及GLP-1药物的治疗策略。 “多囊卵巢综合征的患者有情绪障碍,如果你听她们说,她们会挣扎于焦虑和抑郁,情绪多变。” 💔 子宫内膜异位症的识别与行动 强调“痛经不正常”的核心理念,并列举了性交疼痛、慢性盆腔疼痛、反复膀胱/肠道症状等关键识别信号。指出子宫内膜异位症的诊断平均延迟9-11年,呼吁女性主动要求盆腔超声检查和AMH检测,并解释了手术切除与激素抑制的治疗方案。 “痛经是不正常的。如果你因此缺课,如果你因此请病假不能上班,如果你只能躺在床上……那就不正常。” 🎗️ 乳腺癌风险的自我评估与早期筛查 介绍Tyrer-Cuzick风险评估工具,赋能女性计算自身乳腺癌终生风险。强调高风险女性(>20%)应在30岁开始乳腺影像筛查(乳房X光、超声、核磁共振),并考虑遗传性癌症筛查,以避免延误诊断。 “如果你知道你的名字、姓氏和出生日期,你就需要知道你一生中患乳腺癌的风险。这是强制性的。” 🗣️ 成为自身健康的倡导者 Dr. Aliabadi博士通过自身经历和临床观察,强烈呼吁女性主动学习健康知识,要求医生进行全面检查,并敢于质疑和更换医生,以确保获得应有的医疗关注和治疗。 “如果你赋能一个女人成为她自己的健康倡导者,她有了那个清单,她带着它去医生的办公室,十有八九,就像我说的,医生都是很棒的人,他们是来帮助你的。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名印度企业家Nikhil Kamath对科技巨头Elon Musk的独家专访。这场对话深入探讨了Elon Musk在特斯拉、SpaceX和xAI等多个领域取得非凡成功的秘诀。Elon不仅分享了他对X(原Twitter)未来愿景——一个全球性的集体意识广场,以及AI和机器人技术将如何彻底改变我们的工作模式,甚至可能带来“普遍高收入”的社会。他还大胆探讨了人类是否生活在模拟世界中的哲学命题,以及他认为AI发展中必须坚守的“真理、美和好奇心”三大核心原则。从他独特的“棉花糖测试”理论,到对未来货币形态的预测,再到对创业者“创造多于索取”的真诚建议,Elon Musk以其标志性的幽默感和深刻洞察力,为我们描绘了一个充满挑战与机遇的未来图景。 翻译克隆自:Elon Musk: A Different Conversation w/ Nikhil Kamath | Full Episode | People by WTF Ep. 16 👨⚕️ 本期嘉宾 Elon Musk,特斯拉、SpaceX、xAI等公司的创始人。 ⏱️ 时间戳 播客开场 & 嘉宾介绍 (00:00) 00:00 节目简介与嘉宾介绍 01:56 埃隆对印度创业者的期望 X的愿景与演进 (02:56) 02:56 X的用户规模与核心优势 04:06 内容形式的未来:视频与AI互动 04:46 收购Twitter的初衷与X的使命 06:23 X:全球集体意识的城市广场 生命意义与宇宙探索 (07:47) 08:38 生命的意义:“42”与提问的艺术 09:23 集体意识的力量:从细胞到人类文明 12:16 物理学与灵性:预测价值的追求 埃隆的投资哲学 (12:46) 12:55 长期投资:关注产品、服务与团队 当前最兴奋的项目与未来预测 (14:02) 14:44 SpaceX, Tesla, xAI的融合与协同 15:29 特斯拉FSD与擎天柱机器人 16:14 星链:全球低延迟互联网 16:52 星链的技术原理与应用场景 19:09 星链在人口密集区的局限性 20:46 AI时代的“普惠高收入”与工作可选性 23:19 AI奇点:商品与服务的无限丰裕 24:14 棉花糖测试:延迟满足的解读 “X”情结与货币未来 (25:26) 25:35 “X”的由来:从x.com到SpaceX和孩子 28:53 货币的未来:能量作为终极衡量 31:42 美国债务与AI引发的通货紧缩 模拟世界与哲学思辨 (33:40) 35:14 身处模拟世界的概率 36:58 模拟世界的“神”与最有趣的模拟 38:34 斯宾诺莎与道德:宗教之外的伦理 41:41 对世界现状的看法:历史的苦难与进步 家庭、人口与意识 (46:16) 45:09 生育观与人口下降的担忧 46:28 拥有孩子的意义与价值 47:55 先天与后天:硬件与软件的结合 AI伦理与内容未来 (48:37) 48:37 大学教育的未来与AI的冲击 49:42 AI发展的三大核心原则:真理、美、好奇心 53:10 历史的教训:战争与农耕 55:22 播客与未来内容形式:AI生成视频 56:59 稀缺的现场体验:数字时代的反向价值 商业、政治与幽默 (57:19) 57:19 埃隆的投资观:创造而非投机 58:27 大卫与歌利亚:对巨头的看法 1:07:35 政治的泥潭:避免卷入 1:09:09 Doge项目:政府效率与反欺诈 1:11:46 慈善的挑战:实现真正的善举 1:12:10 移民与人才流失:美国受益于全球人才 对印度创业者的建议 (1:14:18) 1:14:18 创造多于索取:成为社会净贡献者 1:14:56 追求有用的产品和服务,而非金钱本身 🌟 精彩内容 💡 X的使命:全球集体意识的城市广场 Elon Musk阐述了他收购Twitter并将其更名为X的深层原因:旨在建立一个全球性的“城市广场”,一个能汇聚人类集体意识的平台。他强调X不仅提供文字、图片、视频交流,还包含安全的消息系统和音视频通话,并通过自动翻译打破语言障碍,以增进对宇宙的理解,而非仅仅追求多巴胺刺激。 “我主要想做的,就 X 而言,是打造一个全球性的‘城市广场’。在这里,人们可以用文字、图片、视频说他们想说的话。我们还有一个安全的消息系统,最近还增加了音视频通话功能。所以,我们真正想做的,是把整个世界带入一个集体意识中。” 🚀 AI时代的未来:工作将是可选的 Elon大胆预测,在未来10到20年内,由于人工智能和机器人技术的飞速发展,工作将成为可选的,更像是一种爱好。他认为,随着生产力的极大提升,社会将实现“普遍高收入”,人们将能够拥有他们想要的任何商品和服务,从而改变传统的工作模式和城市化趋势。 “我的预测是,在不到二十年的时间里,工作将是可选的。工作本身将是可选的,就像一个爱好一样,差不多。” 🌌 模拟世界理论:电子游戏的启发 Elon Musk认为我们生活在模拟世界中的概率“非常高”。他以电子游戏的惊人发展为例,从《乓》到照片般逼真的多人在线游戏,仅用了50年。他推断,未来游戏将与现实无法区分,并拥有高度智能的非玩家角色(NPC),这使得我们身处“基础现实”的可能性微乎其微。 “看看我们有生之年,至少是我有生之年,电子游戏的进步。它从非常简单的游戏,比如《乓》,就是两个矩形和一个方块来回击打,发展到了可以数百万人同时在线玩的、照片般逼真的实时游戏。这仅仅发生在五十年的时间里。如果这个趋势继续下去,电子游戏将与现实无法区分。” 🧠 AI发展的三大核心原则:真理、美、好奇心 面对AI的巨大潜力与潜在危险,Elon Musk提出了AI发展必须坚守的三大核心原则:真理、美和好奇心。他认为,强制AI相信谬误会带来灾难性后果(引用伏尔泰和《2001太空漫游》中的HAL),对美的欣赏能引导AI向善,而好奇心则能促使AI探索现实本质,从而更好地支持人类的延续与繁荣。 “我认为,在我看来,非常重要的一点是,人工智能必须将追求真理作为最重要的事。不要强迫人工智能去相信谬误,我认为那会非常危险。而且,我认为对美的欣赏也很重要。……真理、美和好奇心。我认为这三样是我认为对人工智能最重要的东西。” 🌟 对创业者的忠告:创造多于索取 Elon Musk向印度年轻创业者们提出核心建议:要“创造多于索取”,成为社会的净贡献者。他强调,财务上的成功不应是直接追求的目标,而是通过提供真正有用的产品和服务自然而然的结果。他鼓励创业者们准备好拼命工作,接受高失败率,并始终专注于价值创造。 “任何想要创造多于索取的人,都值得我的尊重。这是最主要的事情,你们应该以此为目标,创造多于索取,成为对社会的净贡献者。……如果你想在财务上创造有价值的东西,你不应该直接追求它。最好的方式其实是去追求提供有用的产品和服务。如果你做到了,金钱会作为自然的结果随之而来。而不是直接追求金钱。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名学习教练、AI产品经理Justin Sung的深度评测节目。Justin Sung以其对学习科学的深刻理解和对AI领域的敏锐洞察而闻名,他曾指导数千人提升学习效率。在本期节目中,他将为我们带来谷歌最新AI学习工具NotebookLM的详尽测评。Justin坦言,初次体验NotebookLM时印象深刻,但深入使用后,他发现这款工具可能制造了一种“学习的幻觉”。他从新手和专家两种学习视角,以及专注学习、移动学习、任务驱动型学习三种场景,全方位测试了NotebookLM。节目中,Justin肯定了NotebookLM在易用性、多模态内容生成(如视频/音频摘要、思维导图)方面的优势,以及在特定场景下节省时间的潜力。然而,他也犀利指出,AI工具擅长解决资源收集等“小问题”,却未能触及学习中最核心的挑战——即如何有效处理“多元素交互”带来的信息过载,以及如何通过主动思考和组织信息来构建真正深刻的理解。他强调,真正的学习在于“过程”而非AI直接给出的“结果”,过度依赖AI可能反而加剧困惑。Justin还分享了如何开启NotebookLM的“学习指南”功能,以及“挣得答案”等实用建议,帮助听众避免掉入AI学习的陷阱,真正提升学习技能。这期节目不仅是对AI工具的评测,更是一次关于学习本质和如何成为高效学习者的深刻探讨。 翻译克隆自:Google NotebookLM - How to Learn FASTER With AI 👨⚕️ 本期嘉宾 Justin Sung,知名学习教练、AI产品经理。他以对学习科学的深刻理解和AI领域的敏锐洞察而闻名,曾指导数千人提升学习效率。 🌟 精彩内容 💡 “学习的幻觉”:AI工具的陷阱 Justin Sung 犀利指出,谷歌 NotebookLM 等 AI 学习工具可能制造一种“学习的幻觉”。它们擅长解决资源收集等“小问题”,却未能触及学习中最核心的挑战——如何有效处理“多元素交互”带来的信息过载,以及如何通过主动思考和组织信息来构建真正深刻的理解。过度依赖 AI 可能反而加剧困惑。 “我觉得很多人可能认为这个工具对学习很有帮助,但实际上,这更像是一种‘学习的幻觉’。” 🧠 学习的本质:过程而非结果 真正的学习在于“尝试去组织信息的过程本身,而不是最终生成的那个结果”。AI 直接提供结果,跳过了学习者主动思考和建立联系的过程,导致知识无法真正内化。他强调,即使是世界顶尖专家创建的思维导图,如果学习者没有经历思考过程,也无法从中受益。 “真正能促进学习的,是尝试去组织信息的过程本身,而不是最终生成的那个结果。” 🚀 多模态亮点:视频与音频概览 NotebookLM 在多模态内容生成方面表现出色,特别是视频概览和音频概览。视频概览提供了宏观总结,具备个性化课程的潜力;音频概览以播客形式呈现,支持移动学习和互动提问,尤其适合通勤等碎片时间。 “我敢说,设计这个工具的谷歌员工,肯定和学习科学家及研究人员合作过,以确保教学方法遵循了直接教学的最佳实践。” 🛠️ 三大实用建议,避免AI学习陷阱 Justin 提供了三条核心建议:1. 开启“学习指南”功能,强制主动思考;2. 主动“挣得”答案,不当被动学习者,暂停、反思、提问;3. 不要指望 AI 成为学习救星,提升自身学习能力才是关键。他强调,学习的瓶颈在于学习者本身,而非工具。 “你有效学习的能力,不应该取决于你使用的 A I 工具。关键不在于工具,而在于你这个学习者,以及你如何与不同的工具互动。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
📝 本期播客简介 本期我们克隆了知名播客《Matt Turck 的播客》中的一场深入对话,主持人 Matt Turck 邀请到人工智能领域的关键构建者 Łukasz Kaiser。Łukasz 不仅是奠定现代 AI 基础的 Transformer 架构的共同发明人之一,那篇划时代的论文《Attention Is All You Need》正是出自他手,他目前还是 OpenAI 的顶尖研究科学家,正引领着 AI 从预训练模型向推理模型这一重大范式转变。在这期节目中,Łukasz Kaiser 犀利驳斥了“AI 发展放缓”的论调,他指出 AI 能力正以摩尔定律般的指数级速度平稳增长,而推理模型的出现,正如 S 型曲线的下半段,正以惊人的效率解锁前所未有的能力。他会详细解释推理模型如何通过“思维链”和强化学习进行“思考”,以及它们为何在科学和编程领域表现出色,却在某些看似简单的多模态任务上仍显“参差不齐”。我们还将回顾 Transformer 论文诞生背后的故事,探讨 AI 模型的黑箱问题,以及 OpenAI 如何通过“后训练”和“蒸馏”技术不断提升 GPT 5.1 的用户体验。Łukasz 还会展望 AI 的未来,包括通用强化学习、机器人技术以及 AI 对人类工作和泛化能力的深远影响。无论你是 AI 领域的专业人士,还是对前沿科技充满好奇的普通听众,这期节目都将为你揭示人工智能最前沿的奥秘和挑战。 翻译克隆自:What’s Next for AI? OpenAI’s Łukasz Kaiser (Transformer Co-Author) 👨⚕️ 本期嘉宾 Łukasz Kaiser,人工智能领域的关键构建者之一,Transformer 架构的共同发明人(《Attention Is All You Need》论文合著者)。目前是 OpenAI 的顶尖研究科学家,专注于推动 AI 从预训练模型向推理模型的范式转变。 ⏱️ 时间戳 开场 & 播客简介 00:00 AI 能力的平滑指数级增长 02:08 Łukasz Kaiser:Transformer 共同发明人与 OpenAI 顶尖科学家 AI 进展:驳斥“放缓论” 04:15 AI 进展如摩尔定律般指数级增长,从未停止 05:21 推理模型:AI 发展的又一重大转折点,处于 S 型曲线的下半段 06:16 圈内人与圈外人的认知差距:大模型能力远超想象 06:59 案例:ChatGPT 如何从“胡编乱造”到“联网推理” 08:07 Codex 如何改变程序员工作流 AI 发展的“唾手可得”成果 08:47 巨大的工程改进空间:基础设施、bug 修复与分布式计算 09:54 数据质量提升:从 Common Crawl 到合成数据 10:36 多模态能力的显著提升空间 推理模型深度解析 11:35 推理模型:通过“思维链”进行“思考”的大语言模型 12:07 思考过程的训练:从梯度下降到强化学习 13:32 强化学习的局限:更适用于可验证的科学与编程领域 14:10 强化学习的演变:从 RLHF 到大规模强化学习 Łukasz Kaiser 的 AI 之旅 20:27 从理论数学家到 AI 研究员 21:22 谷歌大脑的经历与法国终身教职的“十年假” 22:38 Transformer 论文诞生故事:多方思想的汇聚 23:17 “注意力机制”:深度学习中的“对齐”概念 24:14 Transformer 的核心创新:自注意力机制与工程挑战 25:11 早期质疑:一个模型处理多个任务的“不可能”设想 26:10 从谷歌到 OpenAI:小团队与大公司的文化差异 27:51 OpenAI 内部研究团队的组织方式与 GPU 资源分配 预训练的未来与经济考量 29:35 预训练在科学层面已达 S 曲线顶端,但仍可平稳扩展 30:09 经济因素影响:从“最大模型”到“更小、更便宜的模型” 31:19 “蒸馏”技术:将大模型知识传授给小模型 32:24 GPU 投资与“预训练复兴” 模型可解释性与 GPT 5.1 33:15 模型可解释性:在理解与黑箱之间取得平衡 35:10 GPT 5 到 5.1 的演进:推理、强化学习与后训练的结合 36:18 后训练:提升模型的安全、友好与减少“幻觉” 37:31 GPT 5.1 的风格选择与强化学习 38:42 模型命名方式的转变:从技术对齐到能力导向 推理深度与泛化挑战 40:40 用户引导思考时间:更多思考带来更强能力 41:14 推理模型的“参差不齐”:在某些领域惊人,在邻近领域挣扎 41:57 案例:五岁小孩的数学题难倒顶尖 AI 模型 43:25 多模态与泛化能力:AI 发展的核心挑战 AI 的未来展望 45:07 Transformer 之外的架构探索:ARC 挑战、Yann LeCun 的 JEPA 47:52 Codex 的潜力:成为 AI 研究员的“AI 实习生” 48:06 Codex Max 与长上下文、压缩技术 51:18 AI 对人类工作的影响:以翻译行业为例 53:13 信任问题:AI 自动化与人类审核的必要性 54:12 机器人技术:通用强化学习与多模态的终极应用 55:18 人类对新技术的惊人适应速度 🌟 精彩内容 💡 AI 发展:平滑的指数级增长 Łukasz Kaiser 驳斥了“AI 发展放缓”的论调,他指出 AI 能力正以摩尔定律般的指数级速度平稳增长,这得益于新发展、计算能力提升和工程实践。推理模型的出现是继 Transformer 之后的又一重大转折点,正处于 S 型曲线的下半段,以惊人的效率解锁前所未有的能力。 “如果你审视人工智能的进展,会发现它的能力一直是在平稳地指数级增长。这才是 overarching 的大趋势,从来没有什么迹象让我,至少是我和实验室的同事们,相信这个趋势会停止。” 🧠 推理模型:AI 的新范式 Łukasz 详细解释了推理模型的核心机制:它们在给出答案前会进行“思考”(思维链),并被允许使用工具(如网页搜索)。这种思考过程通过强化学习进行训练,而非传统的梯度下降。推理模型在科学和编程等可验证领域表现出色,但由于多模态能力和泛化性仍有待提升,在某些看似简单的任务上仍显“参差不齐”。 “推理模型就像你的基础大语言模型,但在给出答案之前,它会先进行思考,也就是人们所说的‘思维链’……你想要告诉模型:‘你应该好好思考,你的思考方式要能导向一个好的答案’。” 📜 Transformer 诞生与早期质疑 作为 Transformer 论文的共同发明人,Łukasz 回顾了这一划时代架构的诞生故事。他强调 Transformer 是多方思想汇聚的成果,其核心创新是自注意力机制。他分享了早期业界对“一个模型处理多个任务”这一想法的普遍质疑,以及当时如何未曾预料到 Transformer 能在短短五年内发展成为如今的聊天机器人。 “你从来不会用同一个模型去做三个不同的任务。你干嘛要写 API 来让一个模型处理多个任务?” 我就说:“不不,我们将来要用一个模型做所有任务。” 然后他们就说:“不可能的。” 🚀 GPT 5.1:后训练与经济考量 Łukasz 解释了 GPT 5 到 5.1 的演进,主要得益于推理能力的提升、强化学习的应用以及大量的“后训练”。随着 ChatGPT 用户规模的爆炸式增长,OpenAI 不仅要追求模型性能,更要考虑经济效益,这促使他们重新审视“蒸馏”技术,以训练出更小、更便宜但质量相当的模型。 “纯粹从经济角度考虑,你需要更小的模型。这当然也发生在所有实验室身上,因为一旦经济因素介入,产品化了,你就必须比以前更仔细地考虑价格。” 🤖 AI 的未来:泛化、机器人与信任 Łukasz 展望了 AI 的未来,他认为通用强化学习和机器人技术是令人兴奋的研究方向。他指出,AI 最大的挑战在于泛化能力,即模型能否像人类一样,用少量数据学习并举一反三。他以翻译行业为例,说明即使 AI 能力强大,人类的信任和审核仍不可或缺,人类工作不会消失,但形式将发生巨大变化。 “我相信推理确实能提升泛化能力,但现在我们只在非常狭窄的领域训练它,所以可能还为时过早。但我认为整个人工智能领域最大的问题是,推理本身是否足以提升泛化能力。” 🌐 播客信息补充 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧