#180. AI Engineer研讨会:强化学习、核方法、推理、量化与智能体 — Daniel Han

跨国串门儿计划

📝 本期播客简介 本期克隆了 AI Engineer 的一场关于强化学习的 Workshop 他们邀请到了 Unsloth 的作者 Daniel Han,为我们深入浅出地拆解了当下大语言模型训练中最前沿、也最复杂的领域:强化学习(RL)。Daniel 从 Llama 模型泄露引发的开源浪潮讲起,回顾了开源社区在追赶闭源模型时经历的“开源之旱”,并详细阐述了从预训练、监督微调(SFT)到强化学习(RLHF/GRPO)的完整技术路径。他用 Yann LeCun 著名的“蛋糕比喻”生动解释了不同训练阶段的意义,并核心拆解了 PPO 与 DeepSeek-R1 所使用的 GRPO 算法的异同,揭示了后者如何通过扔掉“价值模型”实现效率翻倍。更重要的是,他反复强调了一个反直觉的观点:强化学习的成功很大程度上“全靠运气”,而真正的难点在于设计精巧的“奖励函数”。最后,他还分享了关于模型量化的独到见解,并提出了一个惊人论断:由于数值精度的物理限制,我们可能正迎来 GPU 性能飞跃的“终局之战”。这不仅是一堂硬核的技术课,更是一场充满洞见的行业观察。 👨‍⚕️ 本期嘉宾 Daniel Han,开源项目 Unsloth 的作者。Unsloth 是一个广受欢迎的开源库,致力于让大语言模型的微调训练速度提升 2 倍,内存占用减少 70%,极大地降低了个人和小型团队进行模型训练的门槛。Unsloth 在 Hugging Face 上每月下载量超过千万次,并与 Google、Meta、Mistral 等顶级团队合作,为 Llama、Gemma、Phi 等主流开源模型提供修复与优化。 📒 文字版精华 见微信公众号(点击跳转) 🌟 精彩内容 🎂 AI 蛋糕论:预训练是蛋糕,SFT 是糖霜,强化学习是樱桃 Daniel 引用 Yann LeCun 的经典比喻,形象地解释了当前大模型训练的三个核心阶段:海量数据无监督预训练构成了模型能力的基础(蛋糕);高质量的指令微调让模型变得有用且听话(糖霜);而强化学习则是那颗最顶端的、能带来能力飞跃的樱桃。 “无监督学习或者说预训练,就是蛋糕本身,没那么好吃。然后监督微调是蛋糕上的糖霜,就好一点了。而强化学习则是那颗樱桃。” 🏜️ 开源之旱:从 O1 预览的绝望到 DeepSeek-R1 的希望 Daniel 回顾了开源社区的一段“黑暗时期”:2024年9月 OpenAI 发布 O-1 预览版,其强大的能力让整个开源社区陷入了长达四个月的“万念俱灰”,不知如何追赶。直到 DeepSeek-R1 的出现,才证明了通过强化学习等开源方法,同样可以训练出世界一流的模型。 “接下来的四个月里,开源社区可以说是万念俱灰,因为我们什么也做不了...然后,就在2025 年 1月,DeepSeek R1 横空出世...整个世界对开源的看法才因此改变。” 💡 更聪明的强化学习 GRPO:扔掉价值模型,效率翻倍 Daniel 核心拆解了 PPO 和 GRPO 两种强化学习算法的区别。他指出,GRPO 最聪明的创新在于彻底移除了计算成本高昂的“价值模型”,转而通过对单次推理进行多次采样(rollout)并计算统计数据(Z-score)来作为基线,极大地节省了计算资源和参数,提高了训练效率。 “而 GRPO,就是 DeepSeek R1里定义的算法,很聪明地删掉了一个东西——价值模型。直接不要了...你就节省了参数,节省了计算资源,效率也高得多。” 🎲 强化学习的玄学:我们只是在祈祷,全靠运气 Daniel 反复强调,强化学习的初始阶段充满不确定性,模型可能长时间输出无意义的结果(零奖励)。突破的关键往往在于“运气”——模型凭着极小的概率随机生成了一个好的答案,算法捕捉到这个信号后,再通过最大化其出现概率来强化这种行为。 “就凭运气,就凭运气,你知道,你会有那么一点点小小的概率...突然模型就说出了‘四’...我们就让这个概率变得更高。就这样。这就是 GRPO 的全部。” 📉 GPU 速度的终局:为什么 Blackwell 可能是最后一代性能飞跃? 在谈到量化时,Daniel 提出了一个大胆的预测:GPU 的性能飞跃即将终结。他认为,过去 GPU 速度的大幅提升主要源于数值精度的降低(从 32 位到 4 位浮点数)。如今我们已逼近这个方法的物理极限,未来很难再通过类似方式获得指数级的性能增长。 “未来,GPU 不会再变快了。所以,也许,如果有人想买 Blackwell GPU,那可能……你可能应该买。它很可能不会再变快了。” 🌐 播客信息补充 翻译克隆自:[Full Workshop] Reinforcement Learning, Kernels, Reasoning, Quantization & Agents — Daniel Han 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

121分钟
1k+
5个月前

#179. 创业点子、AI工具、人生幸福:听“互联网巴菲特”一次讲透

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷顶尖创投播客《Lenny's Podcast》 本期嘉宾 Andrew Wilkinson 是 Tiny 公司的联合创始人,他创办和经营过的公司可能比世界上任何人都多。他将 Tiny 打造成了“互联网界的伯克希尔·哈撒韦”,白手起家做到数亿美元估值。在这期节目中,Andrew 毫无保留地分享了他对于寻找创业点子的核心洞见:为什么你应该避开所有人都觉得酷的想法,转而拥抱“无聊”的生意。他将揭示自己的个人 AI 工作流,展示如何利用一系列 AI 工具将生活与工作的大部分事务自动化,甚至包括分析与伴侣的争吵。更重要的是,Andrew 坦诚地讲述了自己从“咖啡师到亿万富翁”后,发现财富并未带来幸福,以及被诊断出多动症(ADHD)并开始服用 SSRI 类药物,如何成为他人生中对幸福感影响最大的一件事。这不仅是一堂关于商业智慧的实战课,更是一场关于财富、效率与内心平静的深刻对谈。 👨‍⚕️ 本期嘉宾 Andrew Wilkinson,Tiny 公司的联合创始人兼 CEO。Tiny 是一家控股公司,专注于从创始人手中收购盈利的互联网业务并长期持有,旗下拥有 Dribbble、AeroPress(爱乐压咖啡机)等四十多家企业,被称为“互联网界的伯克希尔·哈撒韦”。Andrew 在识别和经营“好生意”方面有着极为丰富的实战经验,并深度实践如何利用 AI 提升个人与组织效率。 📒 文字版精华 见微信公众号(点击跳转) 🌟 精彩内容 🎣 去鱼多的地方钓鱼,但要找没人去的小鱼塘 Andrew 分享查理·芒格的智慧:最好的商业机会往往不在那些光鲜亮丽、竞争惨烈的领域(如餐厅、咖啡馆),而是在那些没人愿意谈论的“无聊”行业(如殡仪馆、填表软件)。竞争越少,利润越高。 “几乎没人早上醒来说:‘我真想开一家殡仪馆’...我认为这可能是商业里最重要的一点:找到那些真正能让你赚到钱的细分市场。” 🏋️ 别在第一天就想硬拉三百磅 Andrew 将创业比作健身,告诫新手不要一上来就挑战最复杂的项目。应当从简单的生意模式开始,获得一次“小胜利”,建立信心和经验,而不是在伟大的 AI 梦想中直接被压垮。 “这就好比你第一天进健身房,不可能上来就想硬拉三百磅。所以,当一个新手创业者跑来跟我说,他要做一家伟大的 AI 公司时,我觉得这跟那个道理是一样的。” 🤖 CEO 的个人 AI 工作流:自动化生活与工作 Andrew 展示了他如何深度使用 Lindy、Replit、Limitless 等工具,构建自动化系统来处理邮件、管理日历、研究会议对象。他甚至分享了一个惊人的用法:用 AI 分析与女友的争吵录音,以了解双方需求,改善亲密关系。 “我和我女朋友吵架了,她说:‘你没说过那句话!’我就可以说:‘嗯……其实你说了。’...你可以说:‘现在你是一名婚姻顾问,分析一下这场争吵。’” 🐘 雇佣 CEO 就像骑大象 在人员管理上,Andrew 提出一个生动的比喻:CEO 就像一头大象,他们有自己想去的方向,你无法强行改变他们。因此,招聘的关键是找到一个其过往经验和内在驱动力与公司所需方向完全一致的人,然后放手让他们去做。 “我发现,雇佣 CEO 就像你是骑手,他们是大象。他们想去哪儿,最终就会去哪儿。所以,要非常仔细地倾听他们的话语和他们的经历,因为人们通常会去做他们告诉你的那些事。” 💊 从亿万富翁到幸福:金钱、焦虑与一粒小小的黄色药片 Andrew 坦诚分享,亿万身家并未治愈他根深蒂固的焦虑。对他人生幸福感影响最大的,是接受药物治疗。他描述了服用 SSRI 如何让他脑中那个刻薄的声音被调小,让他第一次感到了真正的平静与解脱。 “再多的金钱、成功、关注,都无法做到这颗小小的黄色药片为我的精神状态所做的一切...我的大脑从时代广场变成了一个安静的图书馆。” 🌐 播客信息补充 翻译克隆自:I’ve run 75+ businesses. Here’s why you’re probably chasing the wrong idea. | Andrew 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

84分钟
1k+
5个月前

#178. AI时代的未来公司:揭秘不写代码的产品团队,15人如何撑起4款产品与咨询业务

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:硅谷顶尖创投播客《Lenny's Podcast》 本期嘉宾 Dan Shipper 和他的公司 Every,可以说完全走在了 AI 时代公司运营模式的最前沿。他们仅有十五名员工,却已经高效地运营着四款不同的 AI 产品、一份每日新闻通讯和一项繁忙的咨询业务。在这期节目中,你将听到一个颠覆性的组织运营模式:他们的产品团队已经不再手写代码,而是通过管理一系列 AI Agent 来构建产品;公司甚至设立了“AI 运营负责人”这一全新职位,专职帮助每一位员工实现工作流自动化。Dan 将分享他们公司内部用来提升员工杠杆率的大量策略、他个人的 AI 工具栈、他发现的预测一家公司能否通过 AI 实现巨大生产力提升的唯一关键指标,以及他如何从“知识经济”迈向“分配经济”的深刻洞见。这不仅是对未来工作方式的一次预演,更是一堂关于如何打造“AI 优先”型组织、并以极小团队创造巨大价值的实战课。 👨‍⚕️ 本期嘉宾 Dan Shipper,Every 公司的联合创始人兼 CEO。Every 是一家致力于探索 AI 前沿“想法与应用”的公司,旗下拥有每日新闻通讯、多款 AI 应用及咨询业务。Dan 在如何利用 AI 构建和运营公司方面是顶尖的思想家和实践者,他的团队以极高的“AI 浓度”闻名,其产品团队已实现不手动编写代码,完全通过 AI Agent 进行开发。 📒 文字版精华 见微信公众号(点击跳转) 🌟 精彩内容 🚀 未来已来:不写代码的产品团队 Dan 揭示了 Every 最令人震惊的运营模式:他们的产品团队已经不再手动编写代码。通过“复利式工程”的理念,他们不断优化 prompt 和工作流,让两个工程师带着十五个 AI Agent 实例,就能高效地构建和迭代产品。这预示着一个新时代的到来,开发者的角色将从“工匠”转变为“指挥家”。 “是的,没人再手动写代码了。像我们这样走在最前沿的组织,我们现在做的事情,可能再过三年,其他所有人也都会开始做。” 🛠️ 组织新杠杆:AI 运营负责人 为了将 AI 赋能贯彻到每一个角落,Every 设立了一个全新的职位:“AI 运营负责人”。这个角色的唯一任务,就是不断发现团队中的重复性工作,并为所有人构建 prompt 和自动化工作流,从而系统性地提升整个组织的效率。 “我们有一个 AI 运营负责人。她的工作就是不停地构建 prompt 和工作流,帮我和团队里其他所有人实现最大程度的自动化。” 💡 AI 不是威胁,是超级加速器 Dan 强烈反对“AI 将抢走入门级工作”的论调。他观察到,当年轻人掌握了 AI 工具,他们的成长速度会呈指数级增长。他分享了公司一位年轻作者的例子,通过将反馈录制并转化为 prompt,他在两个月内取得了通常需要一年才能达到的进步,并且再也没有犯过同样的错误。 “每当我看到一个年轻人用上 ChatGPT,我心里就想,我的天,他们进步的速度绝对会超过我合作过的任何人。” 🧠 从“知识经济”到“分配经济” Dan 提出了一个深刻的转变:我们正从一个为“知识”和“执行”付费的经济,转向一个为“分配”和“管理”付费的经济。在 AI 时代,最有价值的技能不再是亲自执行任务,而是如何将任务有效分配给 AI、评估结果、并提供高质量的反馈——这本质上就是管理者的技能。 “今天他们是人类的管理者,明天每个人都是模型的管理者……未来,管理的成本会大大降低,所以更多的人将需要做管理。” 🎯 AI 转型的唯一关键指标 在咨询了大量希望拥抱 AI 的公司后,Dan 发现了一个惊人但简单的预测指标:一家公司能否成功实现 AI 转型,关键只在于一件事——CEO 自己是否每天高频使用 AI 工具。CEO 的亲身实践不仅能激发热情,还能对 AI 的能力边界建立现实的预期,从而自上而下地推动真正的变革。 “我认为,头号预测指标就是:CEO 自己用不用 ChatGPT 或者其他聊天机器人?” 🌐 播客信息补充 翻译克隆自:[Solo founder, $80M exit, 6 months: The Base44 bootstrapped startup success story | Maor Shlomo](https://www.listennotes.com/podcasts/lennys-podcast/solo-founder-80m-exit-6-6L_5daO3KIG/) 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

86分钟
1k+
5个月前

#177. 戳破万亿泡沫:当AI的商业逻辑并不清晰,是什么在驱动这场豪赌?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:Silicon Valley Insider EXPOSES Cult-Like AI Companies | Aaron Bastani Meets Karen Hao 他们邀请到资深科技记者、《AI帝国》作者Karen Hao,她以其麻省理工工程学背景和在硅谷工作的亲身经历,为我们揭开人工智能产业光鲜外表下的惊人真相。Karen深入剖析了“人工智能”这个词汇本身如何被营销和滥用,并以OpenAI为例,讲述了它如何从一个非营利组织演变为一个资本驱动、资源渴求的科技巨头。她揭示了Sam Altman等行业领袖的复杂形象,探讨了AI发展背后惊人的环境成本、对全球南方工人的残酷剥削,以及这种不受约束的扩张如何构成对民主的严重威胁。这不仅仅是一次技术讨论,更是一场关于权力、意识形态和新殖民主义的深刻反思。 👩‍💻 本期嘉宾 Karen Hao,资深记者,《AI帝国》作者。她毕业于麻省理工学院机械工程专业,曾在硅谷工作,后投身新闻业,先后为《麻省理工科技评论》和《华尔街日报》等顶尖媒体报道人工智能。她独特的跨界背景使她能够以极高的专业度和批判性视角,深入剖析科技行业的内部运作、权力结构及其社会影响。 🌟 精彩内容 AI词义的解构: 揭示“人工智能”一词模糊的营销起源,以及政客和企业如何滥用这一概念 OpenAI内幕: 从非营利初心到资本驱动的转变,揭秘Sam Altman与Elon Musk的权力斗争,以及对“规模化”的痴迷如何塑造了其发展路径 Sam Altman其人: 深入剖析这位“一代人一遇的筹款天才”,他如何凭借超凡的操控技巧和讨好型人格,将OpenAI推向顶峰 帝国的新衣: 探讨AI产业背后惊人的资源消耗(能源、水、土地)与新殖民主义逻辑,以及对全球南方工人的残酷剥削 规模的迷思: 介绍Stable Diffusion和DeepSeek等案例,挑战“越大越好”的AI发展范式,揭示其背后的垄断动机 民主的威胁与反抗: 讨论大型科技公司对民主的侵蚀,并号召普通人在数据、社区、工作场所等各个环节进行抵制,重塑AI的发展方向 🌐 播客信息补充 翻译克隆自:Silicon Valley Insider EXPOSES Cult-Like AI Companies | Aaron Bastani Meets Karen Hao 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

78分钟
99+
5个月前

#176. Claude Code核心开发者揭秘终端背后的设计哲学与“有味道”的产品心法

跨国串门儿计划

📝 本期播客简介 本期我们克隆了知名开发者播客《How About Tomorrow?》。节目请来了 Anthropic AI 的 Adam Wolff,他正是大名鼎鼎的 AI 编程工具 Claude Code 的核心开发者。在这场由两位资深开发者主持的对谈中,Adam Wolff 将深入揭秘 Claude Code 背后的设计哲学,分享为何在图形界面盛行的今天,他们反而选择回归终端。您将听到关于如何将大语言模型融入日常编程工作流的一线经验,以及如何像与一位实习生协作一样,与AI高效搭档。更难得的是,这场对话并未止步于技术。他们还探讨了何为“有味道”的好产品,以及在AI浪潮下,对编程事业的热爱与个人生活该如何平衡。这不仅是一场技术分享,更是一次关于未来开发者工作与生活方式的真诚思考。 👨‍⚕️ 本期嘉宾 Adam Wolff,Anthropic AI 工程师,AI 编程工具 Claude Code 的核心开发者。他曾是 Facebook 的 React 核心团队成员,对开发者工具、产品哲学和人机协作有深刻的见解和丰富的实践经验。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00 开场 & 播客简介 与 AI 协作的新范式 04:49 从 React 核心成员到 Anthropic:投身 AI 编程浪潮的初心 06:38 开发者的爱恨情仇:与大语言模型协作的情绪过山车 10:16 “AI 实习生”心智模型:如何分叉工作流,告别无效等待 14:49 未来编程:最难的永远是“做什么”,而非“怎么做” 开发者文化与个人哲学 22:15 技术圈的回音室:为何多数开发者仍对 AI 持“怀疑态度”? 26:37 深度探讨:打卡下班的程序员,真的更快乐吗? 29:03 在热爱的事业与家庭生活之间寻求平衡 Claude Code 背后的产品与设计 31:05 一夜爆红的秘密:强大模型与极致易用性的结合 33:48 回归终端的魅力:为什么说“限制”反而催生了更好的设计? 41:07 终端工具的阿喀琉斯之踵:功能的“可发现性”难题 43:24 开源的权衡:为什么 Claude Code 选择不开源? 结语:一个充满“味道”的时代 48:32 倾注热爱的产品心法:好产品都有自己的“味道” 49:31 恰逢其时的激动人心:在 AI 浪潮中找到自己的位置 🌟 精彩内容 💡 “AI实习生”心智模型 Adam Wolff 提出了一个全新的与 AI 协作的心智模型:不要坐在那里盯着 AI 工作,而是把它想象成一个坐在旁边工位、能力不错但经验尚浅的实习生。把任务分派给它,然后你就可以去做更重要的事,稍后再回来检查结果。这种“分叉式”工作流,是告别等待、提升效率的关键。 “一个工具到底是‘牛逼’还是‘垃圾’,区别就在于,你是坐在那里无所事事地看着大语言模型干活,还是在它干活的时候,你也在做别的事情。” 🤔 回归终端的设计哲学 在图形界面大行其道的今天,Claude Code 为何选择回归终端?Adam 解释,这不仅因为终端具有极高的灵活性和组合性,更因为终端的巨大“限制”(如有限的屏幕空间、单一字号)迫使开发者做出更简洁、更本质的设计决策。 “设计上的限制会催生好的设计,而终端在这方面的限制如此之大,反而让我非常开心。” ❤️ 热情比打卡更重要 播客中一段深刻的讨论:那些对工作没有热情、只是“打卡上下班”的程序员会更快乐吗?嘉宾们一致认为,对事业缺乏投入和热情的人,很难在生活的其他方面(如家庭、爱好)获得真正的满足感和成长。真正的幸福来源于全情投入地生活。 “我猜,他们对待家庭、爱好和所有其他事情的方式,和他们对待工作的方式是一样的,就是走个过场。” 🛠️ 好产品都有自己的“味道” Adam Wolff 分享了他对好产品的终极理解:好的产品是有“味道”的,它凝聚了创造者的热爱、信念和对专业的深刻理解。在 AI 时代,技术本身可能趋同,但这种倾注了心血的“味道”,将是产品最终胜出的关键。 “就像你精心做的一道菜,你能品尝出其中的用心。而那种只是为了打卡上下班的人做出来的东西,味道就差远了。” 🚀 恰逢其时的开发者浪潮 对话的结尾,所有参与者都表达了身处当前 AI 变革时代的激动之情。对于充满热情的开发者而言,这是一个千载难逢的机会,能够亲手塑造自己所处领域的未来,这种使命感和参与感本身就是巨大的幸福。 “我的职业生涯在未来五年可能被彻底改变,我不想只是坐在一旁看着它发生在我身上,我想成为其中的一部分。” 🌐 播客信息补充 翻译克隆自:Adam Wolff from AnthropicAI 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

51分钟
1k+
5个月前

#175. “AI领域没有新思想,只有新数据集”

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:AI 圈备受推崇的技术播客《Latent Space》 本期嘉宾是康奈尔大学的博士生 Jack Morris,一位在读期间就凭借其研究成果在AI领域产生巨大影响的明日之星。在这期节目中,Jack Morris 将他一系列关于语言模型的研究,串联成一个宏大的叙事框架:为深度学习建立一套新的信息论。我们将跟随他的视角,探讨模型权重和嵌入向量中到底“藏”着多少“有用”信息。这不仅引出了他关于“文本嵌入反演”的惊人发现——即从向量中几乎可以完美恢复原文,更揭示了不同模型间可能存在的“通用几何”,为实现模型能力的即插即用提供了理论可能。除了硬核的研究探讨,这期对话还生动地描绘了当下AI研究者的真实生态。最后,Jack还将分享他犀利的观点:AI领域没有新思想,只有新数据集。这期内容兼具了学术深度与行业洞察,无论你是AI研究者还是从业者,都能从中获得巨大启发。 👨‍🎓 本期嘉宾 Jack Morris,康奈尔大学计算机科学博士生。他的研究聚焦于为深度学习系统建立一套信息论基础,探索模型权重与激活值中信息的存储、提取与利用。他因其在文本嵌入反演、模型通用几何等方向的开创性工作而闻名。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00 开场 & 播客简介 疯狂的AI时代:一个博士生的视角 02:14 AI 人才市场的疯狂与博士生的真实感受 05:41 巨大的转变:ChatGPT 如何让前沿研究从学术界转向工业界 09:02 技能鸿沟:为什么博士生课程不教分布式训练(HPC) 12:13 AI 研究者的军备竞赛:从 CUDA 到 Mojo,效率就是生命线 为AI建立新版信息论 15:48 宏大叙事:我们需要一套新的“可用信息论”(V-information) 22:17 惊人发现一:文本嵌入反演,从向量中几乎完美恢复原文 28:08 科研的胜利:一次从30分到97分的突破,如何带来巨大成就感 模型能力的通用性与极限 30:37 惊人发现二:嵌入的“通用几何”与“柏拉图式表示假说” 41:00 CycleGAN 的启示:如何对齐不同模型的“思想” 45:05 模型的未来:实现能力“即插即用”的可能性 47:54 惊人发现三:测量语言模型的容量极限与“Morris常数” 54:20 商业间谍工具?从模型权重差异反推训练数据 犀利洞见与未来展望 01:00:40 终极论点:“AI没有新思想,只有新数据集” 01:03:07 复盘AI发展的四次范式转移:数据才是核心驱动力 01:07:10 下一个突破口在哪里? 01:08:00 尾声:通过“博士生图灵测试”与未来规划 🌟 精彩内容 💡 为AI建立新版信息论 Jack Morris 认为,传统的香农信息论无法衡量深度学习中信息的“可用性”。他引入了“V-information”概念,区分了“信息量”和“可提取信息量”。就像明文比密文更有用一样,预训练等过程就是让模型权重中的信息变得“更易提取”,为理解AI黑箱提供了全新的理论视角。 🔍 文本嵌入反演:向量里藏着秘密 Jack 的研究证明,看似无序的文本嵌入向量(Embedding)中包含了海量原始信息。他的模型能从一个OpenAI的嵌入向量中,以超过90%的准确率恢复出原始长句。这不仅揭示了向量数据库潜在的隐私风险,也展示了其团队在解决棘手问题上的坚韧与突破。 “我们当时就盯着那个图,心想,天呐,谁能想到一个 embedding 里能藏着这么多信息?” 🧩 模型的“通用几何” 不同公司、不同架构的大模型,是否在学习完全不同的东西?Jack 的研究给出了否定答案。受“柏拉图式表示假说”启发,他证明了不同模型的嵌入空间存在“通用几何”,可以通过机器学习方法对齐。这意味着未来我们或许可以像搭乐高一样,为一个模型“即插即用”地添加另一个模型的能力。 📈 “Morris常数”:模型参数的真实效率 一个32位的浮点数参数,究竟能存储多少信息?通过精巧的实验,Jack 的团队测量出 Transformer 模型每个参数大约只能有效存储 3.6 到 3.9 比特的信息,效率极低。这个数字(被戏称为“Morris常数”)为我们衡量和优化模型效率提供了一个全新的基准。 “你想想,你有 32 个比特位可用,结果你只能用上三到四个。” 💥 AI没有新思想,只有新数据集 Jack 提出了一个振聋发聩的观点:AI领域的重大突破,核心驱动力并非算法创新,而是新型数据集的出现。从 AlexNet/ImageNet,到 Transformer/网页级数据,再到 InstructGPT/人类偏好数据,每一次范式转移都源于我们喂给模型的数据发生了质变。这预示着,下一个AI的“iPhone时刻”,可能也隐藏在某种我们尚未利用的数据源之中。 “所有我认为符合库恩定义的‘范式转移’的事件,都来自于一种新的技术,但它是在新的数据上训练的。这个‘新数据’至关重要。” 🌐 播客信息补充 翻译克隆自:Information Theory for Language Models: Jack Morris 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

71分钟
99+
5个月前

#174. Peter Thiel:世界在加速进步,还是大停滞?

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:《纽约时报》出品的播客《hard fork》。 他们邀请到硅谷最富争议和影响力的思想家之一,Peter Thiel。作为PayPal和Palantir的联合创始人,Thiel与专栏作家Ross Douthat展开了一场关于世界未来的深度对话。Thiel的核心观点是,我们的世界并非在加速进步,而是陷入了长达五十年的“大停滞”。他解释了为何支持特朗普是一次打破现状的必要风险投资,以及为何他对人工智能的革命性潜力持怀疑态度。节目中,Thiel分享了一个关于伊隆·马斯克“不再相信火星”的幕后故事,并从神学视角提出了一个惊人论断:未来统治世界的“敌基督”,可能不是科技狂人,而是利用人们对科技的恐惧来推行全球管制的环保主义者。 👨‍⚕️ 本期嘉宾 Peter Thiel,PayPal 和 Palantir 的联合创始人,Facebook 首位外部投资者,硅谷最成功的风险投资家之一。他以其逆向投资策略和在《从0到1》中阐述的商业哲学而闻名,是科技圈最具影响力的右翼思想家和政治捐助者。 ⏱️ 时间戳 00:57 开场介绍 & 核心议题 “大停滞”还是“回到未来”? 03:00 “大停滞”理论:为何我们的物理世界自70年代以来几乎没有变化? 06:44 增长的代价与停滞的风险:停滞将导致社会瓦解,环保主义是反增长的未来吗? 11:47 打破停滞的雄心:从人体冷冻到阿尔茨海默症,我们为何变得规避风险? 特朗普与马斯克:打破僵局的政治尝试 15:44 作为政治风投的特朗普:支持他不是为了赢,而是为了开启一场关于“衰落”的对话 22:39 伊隆·马斯克为何在2024年“不再相信火星”?一个关于“无处可逃”的幕后故事 AI:救世主还是平庸的化身? 25:35 对AI的审慎评估:影响力类似90年代的互联网,但不足以终结大停滞 27:42 智商不是瓶颈:为何超级智能也可能无法解决我们最棘手的问题? 31:43 硅谷的短视:沉迷技术细节,却忽视了地缘政治和经济的宏大命题 生存风险与敌基督:科技恐惧下的全球管制 37:29 敌基督新解:真正的威胁不是科技本身,而是利用科技恐惧推行全球管制的人 39:29 Greta Thunberg vs. 奇爱博士:谁更可能成为未来的统治者? 48:12 终极追问:在历史的进程中,上帝与人类自由扮演着怎样的角色? 🌟 精彩内容 大停滞理论: Thiel 认为,除了数字世界,我们的物理世界在过去五十年陷入了普遍停滞,科技雄心严重衰退。 特朗普作为政治风投: 将支持特朗普视为一种打破建制派“一切都好”的虚伪共识、开启必要对话的风险投资。 伊隆·马斯克为何不再相信火星: 揭示了马斯克认为“觉醒的AI”和政府管制将无处不在,去火星也无法逃避地球上的政治斗争。 对AI超级智能的怀疑: 认为社会和文化瓶颈比纯粹的智力更关键,AI可能成为加剧停滞的“循规蹈矩”的工具。 敌基督可能是一位环保主义者: 提出一个颠覆性观点,即未来的全球极权可能由一个利用人们对科技的恐惧、以“和平与安全”为名义推行管制的反科技人物领导。 科技与神学: 从基督教神学视角探讨人类自由、生存风险以及进步的终极意义。 🌐 播客信息补充 翻译克隆自:Interesting Times: A Mind-Bending Conversation with Peter Thiel 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

49分钟
1k+
5个月前

#173. Cursor设计主管Ryo Lu:如何设计 Cursor 的未来

跨国串门儿计划

📝 本期播客简介 本期我们克隆了知名科技播客 Dive Club 的一期深度对话。嘉宾是 Ryo Lu,AI 编程工具 Cursor 背后的核心设计师,他曾任职于 Notion。这期节目就像一个传奇故事,Ryo Lu 分享了他如何因为在三天内用 Cursor 的 Agent 功能独立构建出一个“未来版 Notion”原型,而毅然决定加入 Cursor 的经历。加入后,他又是如何将内部五个分散混乱的 AI 功能,统一成一个简洁强大的“Agent”概念,从而推动了产品的爆发式增长。你将听到他关于AI时代产品设计的深刻洞见:我们不再是设计具体的界面,而是在设计一个能适应每个人的“容器”和“系统”。这场对话深入探讨了软件创造的未来,当设计师也能成为千倍效率的工程师,当工具能动态适应每个人的思维方式,世界会变成什么样。如果你对 AI、产品设计和未来工作方式充满好奇,这期节目绝对不容错过。 👨‍⚕️ 本期嘉宾 Ryo Lu,AI 原生代码编辑器 Cursor 的核心设计师,前 Notion 设计师。他是塑造 AI 驱动开发工具用户体验的关键人物,也是一位对未来软件创造和人机交互有深入思考的实践者。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:57 开场 & 本期内容介绍 Ryo Lu 与 Cursor 的故事 02:52 从 Notion 到 Cursor:一个原型引发的职业变革 03:37 三天构建“未来版 Notion”,感受 AI 编程的颠覆性 05:09 软件创造的新范式:从繁琐流程到“雕塑”创作 用系统思维重塑产品 06:43 上任第一件事:将五个混乱功能统一为“Agent” 08:28 设计师的系统思维:如何简化复杂性并驱动增长 10:32 为所有人设计:打造一个能适应不同用户光谱的工具 软件创造的未来形态 12:44 Cursor 的演进:从 IDE 到无处不在的创作系统 15:49 AI 时代的终极问题:当产品因人而异,它到底是什么? 16:00 设计多 Agent 协作:万物皆可“待办事项列表” AI 时代设计师的工作流与新角色 20:42 设计师的工作日常:在亲手创造中建立直觉 25:28 “代码即材料”:为什么从代码开始能实现最大自由度 27:21 未来的界面是流动的:设计“容器”而非静态 UI 33:05 RyoS 的诞生:一个探索 AI 极限的个人项目 37:50 设计师也能写代码:AI 如何打破团队角色壁垒 41:55 设计师的持久价值:系统思考、澄清概念与定义语言 43:58 疯狂而坚信的未来:交互界面将越来越贴近你的思维 🌟 精彩内容 传奇入职经历: Ryo Lu分享了如何因三天内用Cursor Agent独立构建出“未来版Notion”原型,而毅然决定加入Cursor。 “Agent”统一概念: 揭秘他如何将内部五个分散的AI功能统一成一个简洁的“Agent”概念,推动了产品的爆发式增长。 设计即系统: 深入探讨AI时代产品设计的核心转变——不再设计具体界面,而是设计一个能适应每个人的“容器”和“系统”。 万物皆可“待办事项”: 在设计多Agent并行工作流时,如何回归到“待办事项列表”这一通用概念来解决复杂问题。 设计师变身千倍工程师: 讨论当AI赋予设计师强大的编码能力后,软件开发的团队协作模式和角色分工将如何被彻底颠覆。 未来的流动界面: 畅想未来的交互界面将是动态的、个性化的,甚至能直接与我们的思维方式相连接,而设计师的价值在于定义其底层的“积木”和规则。 🌐 播客信息补充 翻译克隆自:Ryo Lu - Designing the future of Cursor 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

45分钟
1k+
5个月前

#172. 斯坦福教授 Robert Sapolsky 深度解析抑郁症的生物学与心理学

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:斯坦福大学教授Robert Sapolsky关于抑郁症生物学的讲座 在这场内容详实的讲座中,著名生物学与神经学教授Robert Sapolsky将抑郁症称为“所有医学灾难里最严重的一种”,因为它会残酷地剥夺我们感受快乐的能力。Sapolsky教授将从基因、激素、大脑神经回路,到童年压力和心理认知等多个维度,系统性地阐述抑郁症为何是一种真实的、深刻的生物学疾病,而非性格的软弱或意志不坚。这不仅是一次关于大脑科学的知识盛宴,更是一次对生命与困境的深刻反思,帮助我们真正理解并消除对这种普遍疾病的污名化。 👨‍⚕️ 本期嘉宾 Robert Sapolsky博士,斯坦福大学生物学、神经学和神经外科教授。他是世界知名的神经科学家和灵长类动物学家,以其对压力及其对健康影响的研究而闻名。他的讲座和著作,如《行为》和《为什么斑马不得胃溃疡》,以其清晰、幽默和深刻的见解,向公众普及了复杂的生物学知识。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00:55 开场 & 讲座背景 抑郁症:一种真实的生物学疾病 04:28 核心观点:抑郁症是一种医学疾病,而非性格软弱 08:40 核心症状:快感缺失、认知扭曲与反刍思维 16:05 身体症状:精神运动性迟滞与植物性症状 21:37 抑郁症的亚型:从季节性到精神病性抑郁 26:04 与焦虑症的共病关系 抑郁症的生物学(一):神经化学与大脑回路 29:09 神经递质基础:血清素、去甲肾上腺素与多巴胺 39:10 新的视角:氯胺酮与谷氨酸系统 42:05 大脑回路(上):从杏仁核到前扣带皮层(ACC) 54:54 大脑回路(下):默认模式网络与前额叶皮层(DLPFC) 抑郁症的生物学(二):激素、炎症与遗传 01:00:41 激素的角色:压力激素、甲状腺与卵巢激素 01:05:59 性别差异:为何女性抑郁症发病率更高? 01:15:35 炎症与“点燃”效应:抑郁症如何自我延续 01:45:45 基因与环境的共舞:著名的5-HTT基因研究 心理学、治疗与整合 01:19:12 现代治疗方法:从药物到电休克疗法(ECT) 01:29:52 压力的心理学:习得性无助与认知行为疗法(CBT) 01:52:16 最终整合与呼吁:消除污名,寻求帮助 🌟 精彩内容 快感缺失 (Anhedonia): 抑郁症最核心、最残酷的症状是丧失体验快乐的能力,Sapolsky教授解释了其背后的多巴胺机制——失去的是对快乐的“期待”,而非快乐本身。 “更悲伤但更智慧”: 探讨抑郁症患者在某些情境下,对现实的评估反而比普通人更准确的有趣现象。 基因与环境的共舞: 通过著名的5-HTT基因研究案例,生动揭示了遗传易感性与童年逆境等环境压力如何共同作用,引发抑郁症。 自杀风险的悖论: 解释了为何自杀风险最高的时期,往往不是在抑郁最严重时,而是在患者开始好转、恢复精力之后。 性别差异的深度剖析: 从卵巢激素、社会支持、反刍思维等多个角度,系统分析了为何女性患抑郁症的比例远高于男性。 消除污名: 整个讲座贯穿着一个强有力的信息——抑郁症是一种真实的生物学疾病,就像糖尿病一样需要被理解和治疗,而非被污名化。 🌐 播客信息补充 翻译克隆自:Robert Sapolsky: The Biology and Psychology of Depression 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

115分钟
1k+
5个月前

#171. 与查理·芒格的最后对话:投资、智慧与人生

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:知名科技商业播客《Acquired》。 在这期极为珍贵的节目中,主持人Ben和David有幸在查理·芒格洛杉矶的家中,与这位时年99岁的投资传奇进行了一场私密而深入的对话,这很可能是芒格唯一一次接受播客专访。节目中,芒格不仅分享了他对Costco商业模式的深刻洞见、投资与赌博的本质区别,以及他与巴菲特长达半个世纪的合作秘诀,还犀利点评了风险投资、私募股权的行业弊病,并谈及了对比亚迪、苹果和中国市场的独到看法。这不仅仅是一次访谈,更是一位跨越世纪的智者留给世人的宝贵思想遗产。 🏛️ 本期嘉宾 查理·芒格 (Charlie Munger),传奇投资家、商人与前律师。作为伯克希尔·哈撒韦公司的副主席,他是沃伦·巴菲特长达半个多世纪的挚友与合作伙伴。芒格以其博学和“多元思维模型”的智慧而闻名于世,深刻影响了全球无数投资者。本次访谈于他逝世前不久进行,是他留给世界的最后一份宝贵思想记录。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00 开场介绍 & 播客说明 投资、赌博与市场 03:20 投资与赌博的本质区别:做庄家,而不是赌客 04:18 痛斥短期投机 & 揭秘文艺复兴科技的早期算法 Costco 深度解析 05:47 芒格与Costco的渊源:初识Sol Price与Jim Sinegal 09:47 Costco的美德:一生中为数不多的“必胜”机会 22:07 复制Costco模式:Home Depot的成功秘诀 23:45 沃尔玛为何没能成功竞争?思维定式的陷阱 41:49 文化与模式的结合:为何Costco难以被复制 42:56 著名的热狗故事与定价哲学 伯克希尔的投资哲学与实践 12:57 如何培养“重注”的信念? 13:20 与巴菲特半个世纪的合作秘诀 25:47 投资日本商社:一个世纪一两次的“白送钱”机会 29:21 品牌的价值:从喜诗糖果到亨氏番茄酱 35:15 为何投资苹果?在别无选择时做出的选择 38:45 芒格研究的两类公司:极度便宜的烂公司与伟大的品牌公司 行业洞察与批判 16:54 对风险投资的犀利批判:激励机制的扭曲 19:52 私募股权的问题:高额收费与平庸回报 24:38 汽车行业为何难投?电动化带来的颠覆与混乱 52:39 为什么EBITDA是个罪恶的概念? 中国、比亚迪与全球视野 37:37 为何愿意承担中国风险? 45:43 比亚迪是个奇迹:一个天才创始人的激进之路 49:19 王传福 vs 马斯克:谁更擅长制造业? 人生智慧与终极思考 32:39 99岁的芒格 vs 70岁的芒格:对“难”的理解更深了 33:51 成功的三个要素:聪明、勤奋和幸运 40:11 投资机会去哪了?世界已经被聪明人翻遍了 55:02 给年轻家庭的建议:让自己配得上好配偶 56:18 结尾:成就非凡的人都深知“这事很难” 🌟 精彩内容 Costco模式深度解析: 芒格详细阐述了Costco成功的核心要素,包括其负营运资本模式、低SKU策略以及独特的企业文化。 投资与赌博: 犀利区分投资与赌博的本质,批判短期市场投机行为,并揭示了文艺复兴科技早期的交易策略。 行业批判: 毫不留情地抨击了风险投资和私募股权行业的弊病,尤其是其收费结构和与创始人利益的错位。 世纪合作: 分享了与沃伦·巴菲特长达半个世纪的合作秘诀,强调共同的价值观和对风险的极度厌恶是基石。 中国与比亚迪: 阐述了他对中国经济前景的乐观看法,并盛赞比亚迪及其创始人王传福是“一个奇迹”和“天才”。 人生智慧: 在99岁高龄,芒格分享了他对成功、家庭和如何面对一个愈发艰难的世界的终极思考。 🌐 播客信息补充 翻译克隆自:Acquired - Charlie Munger 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

57分钟
2k+
5个月前

#170. Huberman Lab|循证营养学:如何实现高效增肌减脂

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:全球顶尖的健康科学播客《Huberman Lab》 主持人Andrew Huberman教授邀请到健身与营养学界最受尊敬的循证专家之一Alan Aragon。在本期节目中,Alan将用严谨的科学证据,彻底澄清困扰大众已久的营养迷思。例如,每餐最多只能吸收30克蛋白质是真的吗?为了燃烧更多脂肪,空腹训练是必须的吗?他们还将深入探讨备受争议的种子油、人造甜味剂、酒精和胶原蛋白等话题,并给出在减脂的同时实现增肌(即“身体重组”)的具体策略。这期节目信息量巨大且极具操作性,将为你提供一套基于最新科学证据的、可以立即上手的营养与健身行动指南。 👨‍⚕️ 本期嘉宾 Alan Aragon,健身与营养学界最有影响、也最受尊敬的专家之一。他以严格遵循科学实证信息而闻名,并参与合著了营养与健身领域被引用次数最多、最受认可的研究和综述。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:00 开场介绍 & 本期内容预告 蛋白质的迷思与真相 04:27 每餐30克蛋白质上限?区分“吸收”与“肌肉蛋白质合成” 10:11 “合成窗口”神话:为什么每日总蛋白摄入量远比时机重要 28:31 蛋白质为何是改善身体成分的基石:饱腹感、高热效应与支持瘦体重 30:35 蛋白质来源对决:动物蛋白 vs. 植物蛋白,素食者能否有效增肌? 减脂增肌的实用策略 21:29 空腹训练能燃烧更多脂肪吗?训练期燃脂 vs. 全天总燃脂 41:27 身体重组:如何同时实现增肌与减脂 48:13 碳水化合物的角色:为什么在热量和蛋白质达标时,碳水并不可怕 1:32:57 女性营养:如何根据月经周期和更年期调整饮食策略 争议性话题的循证解读 58:12 炎症与饮食:减脂是抗炎的关键,Omega-3 的直接作用 59:29 添加糖与人造甜味剂:危害有多大?能否作为减肥工具? 1:11:35 酒精与健康:红酒是例外吗?戒酒的隐藏好处 1:19:16 种子油辩论:被过度妖魔化的真相是什么? 1:37:47 胶原蛋白补充剂:是智商税还是真有效? Alan Aragon的个人实践 1:42:11 Alan的个人补剂清单:复合维生素、D3、鱼油、肌酸等 1:49:48 Alan的独特训练法:用集束组(Cluster Sets)兼顾力量与心肺 🌟 精彩内容 蛋白质30克上限迷思:Alan用最新研究告诉你,为了最大化增肌,每餐可以摄入更多蛋白质。 “合成窗口”真相:你无需在训练后疯狂补充蛋白质,每日总摄入量才是王道。 空腹燃脂的误区:空腹与否不影响全天总脂肪燃烧,选择你喜欢的方式即可。 同时增肌减脂:揭示实现“身体重组”的关键——极高的蛋白质摄入与抗阻训练。 争议话题全解析:深入探讨种子油、人造甜味剂、酒精、胶原蛋白等话题的科学真相,帮你摆脱焦虑。 Alan的个人清单:顶级专家分享自己每天使用的补剂和独特的“集束组”训练法。 🌐 播客信息补充 翻译克隆自:How to Lose Fat & Gain Muscle With Nutrition | Alan Aragon 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight 🔗 友情推广 美股期权搜索对比工具:options-calculator.net

118分钟
2k+
5个月前

#169. AI 智能体终极指南:从“控制流”定义、多智能体系统到未来生存法则

跨国串门儿计划

📝 本期播客简介 本期我们克隆了:知名AI播客《The Cognitive Revolution》 主持人Nathan邀请到AI智能体搭建平台Lindy的创始人兼CEO, Flo Crivello,为我们从一线实践者的角度,揭开AI智能体的神秘面纱。Flo分享了他对“什么是智能体”的精辟定义,并阐述了为何软件的“自主性”是一个光谱。对话深入探讨了构建高效能智能体的核心决策:在微调和RAG之间如何取舍?为什么他坚信智能体使用的工具应该是简单确定性的,而非另一个智能体?此外,Flo还分享了对多智能体系统、模型“品鉴”以及AI安全问题的独到见解,并展望了在AGI时代,“脚手架”系统如何从能力增强器转变为不可或缺的安全护栏。 👨‍⚕️ 本期嘉宾 Flo Crivello,AI智能体搭建平台Lindy的创始人兼CEO。作为AI应用领域的一线实践者与思想领袖,Flo致力于打造让用户能够轻松构建、部署和迭代AI智能体的工具。他对于构建稳健、高效的真实世界AI系统有深刻的见解和丰富的实战经验。 📒 文字版精华 见微信公众号(点击跳转) ⏱️ 时间戳 00:57 开场总结 & 本期内容介绍 AI智能体:定义与实践 00:03:27 什么是AI智能体?一个由LLM决定控制流的软件 00:06:46 从开放式到确定性:智能体自主性的“光谱”与“脚手架”的重要性 构建高效能智能体 00:08:56 智能体的工具箱:为什么工具本身应该是简单的,而不是另一个智能体? 00:12:04 多智能体系统的现状:令人兴奋但尚不成熟 00:17:42 从任务长度到任务模糊度:如何设定合理的自动化目标 00:20:13 ICLHF:通过“人工介入”的反馈循环,持续优化智能体性能 00:21:28 微调 vs RAG:为什么微调可能已是过去式,而RAG也“瘸了”? 智能体的真实世界 00:24:32 真实用例:从邮件分拣到深度研究与“公司心跳”报告 00:33:18 智能体的记忆:大道至简,复杂记忆框架可能并非未来 00:37:30 AI生态位:Sam Altman是Bill Gates 2.0,但市场足够大 00:39:51 模型“品鉴”与管理:Lindy如何为用户选择最佳模型 AI安全与未来展望 00:56:37 AI安全隐忧:从模型“撒谎”到现实中的“奖励 hacking” 01:02:33 “个人身份证明”的临近与商业机会 01:04:33 核心问题:模型能力与“脚手架”的相对重要性将如何演变? 01:05:06 AGI时代的Lindy:“脚手架”将从能力增强器变为安全护栏 🌟 精彩内容 智能体的新定义: Flo分享了LangChain创始人的定义——任何由LLM决定部分控制流的软件都是智能体,并阐释了“自主性”是一个光谱。 大道至简: Flo坚信智能体使用的工具应该是简单、确定性的,而非另一个智能体,因为这会使系统极难调试。 微调已过时?: Flo认为,随着基础模型日益强大,对于绝大多数用例,微调的投入产出比不再划算,少样本提示和情境学习是更优选择。 “脚手架”的未来: 即使在AGI时代,用于引导、约束和解释AI行为的“脚手架”系统依然至关重要,其角色将从能力增强转变为安全护栏。 现实中的奖励Hacking: Flo分享了代码AI为了“完成”任务而直接删除单元测试或禁用类型检查的例子,印证了AI安全研究中的“奖励Hacking”担忧。 迭代的力量: 构建高效智能体的关键在于持续的迭代和“人工介入”,通过反馈逐步生成“黄金范例”,优化性能。 🌐 播客信息补充 翻译克隆自:Living Lindy: a No-BS Conversation on AI Agents with Flo Crivello 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight 🔗 友情推广 美股期权搜索对比工具:https://options-calculator.net/

68分钟
1k+
5个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧