2025年这个春节,DeepSeek一举改写了全球AGI大叙事。在万般热闹之际,我们特别想沉下来做一些基础科普工作,一起来研读这几篇关键的技术报道。 今天这集节目,我邀请加州大学伯克利分校人工智能实验室在读博士生潘家怡,来做技术解读。他的研究方向是语言模型的后训练。 这期播客中,家怡将带着大家一起来读,春节前DeepSeek发布的关键技术报告,他在报告中发布了两个模型DeepSeek-R1-Zero和DeepSeek-R1;并对照讲解Kimi发布的K1.5技术报告,以及OpenAI更早之前发布的o1的技术博客,当然也会聊到它春节紧急发布的o3-mini。这几个模型聚焦的都是大模型最新技术范式,RL强化学习。 希望我们的节目能帮更多人一起读懂这几篇论文,感受算法之美,并且准确理解目前的技术拐点。 (以下每篇技术报告都附了链接,欢迎大家打开paper收听✌️) 期待2025,我们和AI共同进步! 【嘉宾小记】 加州大学伯克利分校人工智能实验室在读博士生,上海交通大学本科毕业。他的研究方向主要集中在语言模型的后训练领域,通过强化学习等方法提升AI在智能体行为决策与推理方面的能力。这是他做的有关R1-Zero小规模复现工作:github.com 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 03:46 讲解开始前,先提问几个小问题 16:06 OpenAI o1技术报告《Learning to reason with LLMs》讲解 报告链接:openai.com 中文标题翻译:《让大语言模型学会推理》 OpenAI在报告中有几个重点: * Reinforcement Learning — 强化学习 * It learns to recognize and correct its mistakes. It learns to break down tricky steps into simpler ones. It learns to try a different approach when the current one isn’t working. (它学会识别并纠正自己的错误,学会将复杂的步骤分解为更简单的步骤,学会在当前方法行不通时尝试不同的解决途径。)这些是模型自己学的,不是人教的。 * 我们还在技术早期,他们认为这个技术可拓展,后续性能会很快攀升。 33:03 DeepSeek-R1-Zero and DeepSeek-R1技术报告《DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning》讲解 报告链接:github.com 中文标题翻译:《DeepSeek-R1:通过强化学习激励大语言模型的推理能力》 35:24 摘要(Abstract) 37:39 导论(Introduction) 44:35 发布的两个模型中,R1-Zero更重要还是R1更重要? 47:14 研究方法(Approach) 48:13 GRPO(Group Relative Policy Optimization,一种与强化学习相关的优化算法) 57:22 奖励建模(Reward Modeling) 01:05:01 训练模版(Training Template) 01:06:43 R1-Zero的性能、自我进化过程和顿悟时刻(Performance, Self-evolution Process and Aha Moment) 值得注意的是,“Aha Moment”(顿悟时刻)是本篇论文的高潮: 报告称,在训练DeepSeek-R1-Zero的过程中,观察到一个特别引人入胜的现象,即“顿悟时刻”。这一时刻出现在模型的中间版本中。在这个阶段,DeepSeek-R1-Zero通过重新评估其最初的方法,学会了为一个问题分配更多的思考时间。这种行为不仅是模型推理能力不断增长的有力证明,也是强化学习可能带来意想不到且复杂结果的一个迷人例证。 这一时刻不仅是模型的“顿悟时刻”,也是观察其行为的研究人员的“顿悟时刻”。它凸显了强化学习的力量与美感:我们并没有明确地教导模型如何解决问题,而是仅仅为其提供了正确的激励,它便自主地发展出高级的问题解决策略。这种“顿悟时刻”有力地提醒我们,强化学习有潜力在人工智能系统中解锁新的智能水平,为未来更具自主性和适应性的模型铺平了道路。 01:14:52 模型能涌现意识吗? 01:16:18 DeepSeek-R1:冷启动强化学习( Reinforcement Learning with Cold Start) 01:24:48 为什么同时发布两个模型?取名“Zero”的渊源故事? 01:28:51 蒸馏:赋予小模型推理能力(Distillation: Empower Small Models with Reasoning Capability) 01:35:27 失败的尝试:过程奖励模型(PRM)与蒙特卡罗树搜索(MCTS) 01:42:33 DeepSeek-R1技术报告是一片优美精妙的算法论文,有很多“发现”,这是它成为爆款报告的原因 01:43:50 对DeepSeek-R1训练成本的估算: 往高里估,一万步GRPO更新, 每步就算1000的batch size(试一千次),一次算一万个token;模型更新用的 * $2.2 / 1M tokens, * 总共是100B tokens — 0.22M * 算上效率损失,模型训练也有一定开销,说破天也就1M;如果优化的话很有可能只有10万美金左右的成本 * 相比之下,预训练用了600万美金,相当便宜 01:49:05 KIMI K1.5技术报告《KIMI K1.5: SCALING REINFORCEMENT LEARNING WITH LLMS》讲解 中文标题翻译:《KIMI K1.5:利用大语言模型扩展强化学习》 报告链接:arxiv.org 该报告公开了许多技术技巧细节,对于想要复现的人,两篇paper一起使用更佳。如,数据构造、长度惩罚、数学奖励建模、思维链奖励模型、异步测试、Long2short、消融实验等。 02:20:07 DeepSeek论文的结尾谈未来往哪里发展? 02:24:35 以上是三篇报告所有内容,接下来是提问时间,我们继续强化学习一下! “数据标注”在几篇论文中藏得都比较深,小道消息OpenAI一直以100-200美元/小时找博士生标数据 “DeepSeek的论文隐藏了技术细节,但把算法的精妙之处和美展现给你,让你感受技术之美,给你震撼。” 它解密了后训练范式革命可以何处去,让你发现原来算法这么简单! 再一次验证——“最优美的算法永远是最干净的。” 关于强化学习往期节目: AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4 和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角 王小川返场谈o1与强化学习:摸到了一条从快思考走向慢思考的路 开源一场关于DeepSeek的高质量闭门会: 一场关于DeepSeek的高质量闭门会:“比技术更重要的是愿景” 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺 更多信息欢迎关注公众号:张小珺
2025刚开年,全球AI届就已高度共识,将2025年定义为“智能体元年”。 北京时间1月24日凌晨,OpenAI率先抢跑,发布智能体产品Operator(操作员),打响了全球智能体竞赛的第一枪。 在Operator发布前,广密在我们的节目中预言,25年核心关键词是Agent、Agent、Agent,这些AI产品最终会演变成一个任务容器,朝着“下一个Google”方向进发。 本集节目,在Operator发布后,我邀请前OpenAI研究员、清华叉院信息研究院助理教授吴翼,从技术视角解读Operator和Agent之年。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 02:55 对Operator的感官感受 * 04:19 Operator在AGI路线图上的地标:多模态、连续交互、闭环控制系统 * 06:34 OpenAI内部还有更好的模型,智力会刷得很高,Operator带有泛化性 * 08:17 Operator是多模态、闭环的o1,一个Agent o1的版本 * 08:57 为什么Operator是单独入口? * 11:13 Operator包含的技术要点:基座模型、高质量数据集、高效大规模支持Agent的强化学习系统 * 14:10 有关Operator底层用的新模型:Computer-Using-Agent(CUA) * 19:02 2025是Agent之年:多模态模型+强化学习 * 20:49 回溯到2016年,OpenAI成立后第一个大项目就是Web Agent,但失败了 * 22:40 OpenAI的5级分类:聊天机器人Chatbots〉推理者Reasoners〉智能主体Agents〉创新者Innovators〉组织Organizations,技术演进轨迹,人类参与越来越少 * 31:26 Operator在与人类协作时,如何平衡自主决策和人类指令的优先级? * 32:30 Operator怎么整合语言、视觉和动作等不同模态的信息? * 34:11 Operator能否支持与其他Agent的协作?这种协作的机制是什么? * 38:45 广密说Chatbot不是提取智能最有效的交互方式,Operator能有效提取智能吗? * 42:14 OpenAI智能提升与更多产品的关系 * 49:48 Agent这个词从博弈论进入人工智能,现在指大语言模型调用外部世界 * 54:29 Agent中有创业公司的机会吗? * 58:57 Operator释放了信号:逻辑推理从抽象世界走向视觉物理世界的开端 * 01:02:27 如果Agent在未来成为主流,人类与AI的协作方式会发生哪些变化? * 01:06:46 大公司全部开着重装坦克往前走,其他人怎么办? 预言单集:大模型季报年终特辑:和广密预言LLM产品超越Google之路 吴翼往期:和OpenAI前研究员吴翼解读o1:吹响了开挖第二座金矿的号角 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺 更多信息欢迎关注公众号:张小珺
这里是《张小珺商业访谈录》2025年与大家见面的第1集节目,我邀请的嘉宾是理想汽车创始人兼CEO李想。 2024年12月,理想将车机助手理想同学作为手机版App推出,并于此前做了基座大模型。这相当于,这家人们认知中的新能源车企,要跨界参与到与字节豆包、Kimi等个人助手的红海之战。 这场对话涵盖了这名非技术背景、被认为在产品上有天赋的创始人,过去两年对人工智能完整的技术与产品观的思考。他也首度谈了谈,MEGA失利、苹果放弃造车、雷军造车成功、如果他当了OpenAI CEO、理想会做机器人吗、怎么管理00后等各种话题。 此外,播客还放出了一部分加长版聊天。这部分和此前两小时会稍微有一些重复,保留的都是一些觉得李想有增量表达,也许能给大家一些启发的地方(如果不想听,可以直接跳过)。 同时,这部分偏后的篇幅会更加个人,聊了聊一名宅男的日常生活,他长达几十年的玩游戏史,改变过他的游戏,以及从游戏中获得的世界观。 祝大家2025年,正直勇敢有阅读量:) 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:55 第一节:谈人工智能 * 1. 我绝对不止做一棵树了 * 2. 你都不能让你雇的人相信,你怎么让大众相信? * 3. 我做OpenAI CEO会比Sam Altman更好吗? * 4. 理想同学+Mind GPT要去和豆包、Kimi竞争了? * 5. 基座模型是操作系统+编程语言 * 6. L4就是智能体 * 7. 终极产品想象是硅基家人 * 8. 人工智能表达的是能力,不是功能 * 9. 李想有理想吗? 56:12 第二节:谈智能驾驶 * 1. 三年我们能推出把方向盘摘掉的产品 * 2. 我们相比特斯拉又不缺胳膊少腿 * 3. L4实现,买车的人会更多 * 4. 我们100%会做机器人,但不是现在 01:17:50 第三节:谈汽车之战 * 1. 买法拉利 * 2. 复盘MEGA失利 * 3. 今天做的所有事是为了拿L4门票 * 4. 对雷军说,小米车要想成功,你必须all in * 5. 2030年,我们有概率做一辆超级跑车 * 6. 我从来没有司机 01:42:47 第四节:消失的李想 * 1. 典型的李想的一天 * 2. AI是知识、认知和能力平权 * 3. 我人生最大改变是,对自己好 * 4. 从对事不对人,到先对人再做事 * 5. 只要所有的中国企业不放弃 02:08:42 以上是对李想的正式访谈内容,以下是播客的加长内容。 * 02:08:42 补充内容(可跳过) * 02:31:49 宅男、家庭、孩子、《再见爱人》、游戏和天梯 * 02:49:24 最后的快问快答 嘉宾推荐的书: 《高效能人士的七个习惯》 苹果三部曲:《史蒂夫·乔布斯传》《蒂姆·库克传》《乔纳森传》 【更多信息】 本集文字版本:腾讯新闻原文 & 作者的收藏夹 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
今天这集是我和广密【全球大模型季报】第5集,是2024年Q4季报,也是我们录制的第二次跨年特辑。 提前和大家见面啦:) 这次你会发现,我们的聊天篇幅开始从大模型技术转向对大模型产品的探讨。很大概率来说,产品会是2025年AI的最大趋势之一。AI产品会如何落地?产品形态又会如何演变? 广密带来了最新猜想。他提出,过去半年他最强烈的认知变化是,不管国外的ChatGPT、Anthropic、xAI、Perplexity,还是国内的豆包、Kimi,甚至是做Coding相关的Cursor、Devin……虽然各个产品的产品形态不一,从不同路径发散,但最后会殊途同归。他们最终很可能收敛到同一个叙事之下,争夺同一片领地。 很开心转眼之间,【全球大模型季报】已经陪伴大家1年,明年仍然希望这个系列能持续地帮大家了解最前沿的AGI动态并带来认知进化。 本集是《张小珺Jùn|商业访谈录》和《海外独角兽》的串台节目。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯。 02:33 Part 1: OpenAI * ChatGPT本质是奔着“下一个Google”方向去了,如何beat Google是最大的牌 * 一定要逛计算机历史博物馆,理解“计算架构+信息分发”演变的主线逻辑 * Google也是从Yahoo边缘市场撑大做起来,伟大公司是从边缘市场起来 * 小红书非常有意思,融合了搜索+推荐+问答+做任务一体化 * 这些产品最终的最终会变成任务引擎、任务容器,是下一个Google * 电商过去最核心的是GMV,订单转化率,AI时代我感觉是任务完成率 * Chatbot对话形态大概率不是提取智能最有效的交互方式,模型如何更主动? * 可能的一个产品形态是个人助理或者超级助理 * Context非常核心,绝大多数人都还没意识到,是一条关键的暗线 * 如果AI的生成能力增强了,未来会生成的是什么?Mobile最大增量是内容,LLM最大增量新型软件 * 既然这些LLM产品想成为Google已经变成了一张明牌,你觉得Google有能力阻止这件事发生吗? * “下一个Google”的产品,会是一家垄断吗? * 微软和OpenAI同床异梦,微软可能会投资Anthropic 51:04 Part 2: 硅谷其他AI公司和产品 * Anthropic:得Coding,得开发者,得API消耗,有机会得生态,做OS * Anthropic比较专注Agent,怎么让Agent更快落地是更高优先级 * Killer App长期要有竞争力,要端到端垂直整合能力,向下优化,优化成本、模型架构、模型大小、调整模型数据分布、甚至向下优化推理芯片 * xAI:还是注定要成功,但是upside还有多少不太确定 * Perplexity:更像是一个信息处理的Agent * Cursor:Coding产品形态要快速迭代,之前补全下一个代码,Cursor补全下一个Action,明年可能端到端生成软件 * Devin:第一个真正意义上做长距离复杂任务的Agent,明年最具有商业价值的是long horizon Agent(长期规划智能体) * Mistral:已经不用再关注了,他们内部也正式放弃预训练了 01:02:24 Part 3: 对2025/2026关键预言性判断 * 1/ Long horizon task 是下个重点,重要核心圈子几个大佬级人物都在重点做 * 2/ 产品形态的探索,全新的交互界面 * 3/ AI商业模式的探索,今天商业模式还是移动梦网时代 * 4/ 高质量+scalable的数据,尤其是各个垂直行业里面,有没有几千条甚至上万条,任务+Reward数据,要高水平专家标注 * 5/ GPT-5/4.5 Orion:提升能有多大 * 6/ O1后面天花板走到哪:大规模scale RL/o1之后会怎么样,会不会很快遇到瓶颈 * 7/ 假设Coding能力明年提升10倍,软件开发范式怎么改变 * 8/ Context很重要,大家都还不够重视 * 创业公司没法同时做好这么多,得找锋利的切入点,一根针捅破天 01:11:11 Part 4: 再谈Scaling Law * Ilya最近提的pretrain data wall(预训练数据壁垒)是什么? * 后训练中有一个关键问题是奖励模型(reward model),整个地球上没有一个reward model衡量所有人,你相信会未来有吗? * O1系列天花板会卡在哪?这条路通往AGI吗? * Scaling Law关键阻碍不是算力,不是算法,是data问题 * ChatGPT有数据飞轮吗?未来会出现吗?哪些产品里有高价值数据? 01:22:19 Part 5: 复盘2024 * 回顾一下,能定义2024年全球大模型产业的关键时刻? * 全球大模型又狂卷一年,卷出了什么? * 今天想要进入决赛圈,条件是什么? * 哪些去年的判断你今天更坚信了,哪些去年的判断你今天认知有改变? * Mega7巨头里面最看好哪个? * 硅谷人才在流向哪几家公司? * 明年如果只投一个方向,投什么? * 这一轮大的机会,我总结是这3个…… * 2024关键词?2025关键词? 【全球大模型季报】系列 2023年:口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观 2024年Q1:和广密聊AGI大基建时代:电+芯片=产出智能 2024年Q2:口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态 2024年Q3:AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
Kevin Xu曾经参加奥巴马总统竞选,并在美国商务部和白宫都工作过。今天,我邀请他来聊聊美国总统大选的幕后故事。 由于Kevin在科技业从业多年,他提供了一种有意思的视角来看美国政治与大选活动——总统候选人作为一个产品,它在走向市场的过程中,如何与国家叙事实现PMF(Product Market Fit,产品市场匹配度)? 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 01:30 自我介绍 * 02:23 22岁参与奥巴马竞选团队,后担任他在白宫的新闻助理 * 03:13 美国大选的框架:scale up、地推、集资、媒体… * 06:46 大选就是把产品(候选人)和市场(国家环境)做Product Market Fit * 08:25 总统竞选成员每天具体在干嘛? * 14:31 大选输赢对于竞选团队成员的职业生涯有多大影响? * 15:30 大选怎么获胜?“首先你的产品要好” * 19:25 从商务部(骆家辉任上)到白宫新闻部,给奥巴马写新闻稿 * 22:08 特朗普的胜选在预期内,有些与08年雷同 * 25:09 特朗普是个好产品吗?共和党缘何胜利?民主党缘何惨败? * 30:12 奥巴马这个产品如果放在现在,还能fit今天的美国吗? * 31:35 哈里斯是一个仓促的、还没有准备好的产品? * 32:19 我在大选框架中亲历4次,大选当天都是枯燥的一天 * 33:36 是共和党跟着特朗普走,不是特朗普跟着共和党走,特朗普就是特朗普 * 34:50 特朗普如何争取硅谷精英选票?他对美国科技业的后续影响? 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
做这集节目是因为,我想看看那些融了很多钱的AI创业者在干嘛?他们似乎已经很久不出来发声了,把整个舆论场留给几家基础大模型公司和巨头们。 本集嘉宾是深言科技创始人岂凡超。 他公司的融资规模没有大模型公司那么大,但相比一般的创业者,也已经属于账上有非常多钱的了。在去年融资中,估值12亿元人民币。拿了这么多钱找方向,做了1年,他们现在怎么样了? 这是岂凡超第一次接受访谈。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 01:48 自我介绍 * 02:45 94年,博士还没毕业开始创业 * 12:49 清华AI创业的脉络和门派 * 14:34 ChatGPT之前,见了100个投资人 * 22:18 ChatGPT之后,资本环境发生过山车式的变化 * 25:39 23年下半年开始发现差异化训模型变难,于是战略转型 * 29:30不认可模型即产品,未来没有模型公司 * 33:50 我们产品有5个模型组合,试图解决模型输出不确定性 * 40:11 产品构想:新闻阅读?信息助手? * 42:40 内容生产消费分发变迁史 * 44:52 内容是信息的载体,从以内容为颗粒度到以信息为颗粒度 * 53:36 内容生产消费链路变化,重心一直从内容创作者往消费者移 * 56:49 新一代创作者会是什么样? * 60:06 刚上线的产品:语鲸 * 70:30 聊聊好产品:Cursor、NotebookLM、Perplexity * 73:55 创业像航海,没有航海图 * 81:18 我干的一件很蠢的事 * 83:18 90后CEO幼稚吗?大发雷霆吗?两面三刀吗?画饼吗?喜欢管理者做信息差管理吗? * 88:28 大模型输出的不确定性很大程度影响AI组织 * 102:15 最后的快问快答 嘉宾推荐的书: 《自私的基因》 《学会提问:批判性思维指南》 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
最近关于英伟达战略和组织的新书《英伟达之道》上线,这本书的作者Tae Kim专访了黄仁勋。我邀请本书译者和上过我们节目的王亚军来聊聊:黄仁勋和3万亿美元英伟达是如何炼成的? 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 02:45 黄仁勋的危机感来源:移民家庭、在“问题少年学校”受霸凌 * 09:54 服务员黄仁勋特别不喜欢顾客点奶昔 * 16:16 英伟达的三位创始人和创办(黄仁勋、普里姆和马拉科夫斯基) * 22:05 Nvidia为什么叫Nvidia:要成为让所有人嫉妒的公司? * 23:52 英伟达发展的三个阶段:从NV1、NV2的败笔开始 * 36:22 细数英伟达发展史上的重大战略决策,成功的和再次失败的 * 48:57 黄仁勋怎么治理公司?白板文化、Top 5、机长、“战略不是文字,是行动”、“运送一整头牛”… * 01:30:16 联合创始人普里姆的离开,黄仁勋没有二号位 * 01:33:11 3万亿美元英伟达是如何炼成的? 往期英伟达节目:谈谈黄仁勋搭建的组织系统:分布式操作系统,“就像一台GPU” 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
最近,我访谈了以太坊联合创始人Vitalik Buterin,他站在加密技术(Crypto)的彼岸远眺人工智能技术。 Vitalik是俄裔加拿大人,出生于1994年,19岁大学辍学创立以太坊,20多岁成了最年轻的加密亿万富翁。在中国,人们称他“V神”。 他试图阐述一种技术哲学观。在他的认知中,AI和Crypto代表的是两种底层哲学。AI更中心化、富有权力,它可能正在构建史无前例的强大权力中枢;而Crypto相反,倡导的是一种去中心、平等的生存主义哲学。 技术革命或将推动关乎人类命运的“权力游戏”。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 02:00 我会6门语言 * 05:00 站在Crypto技术浪潮那一端看人工智能革命,在想什么? * 10:03 AI是非常有权力的,ChatGPT是非常中心化的应用 * 13:35 OpenAI第一步为了安全牺牲了开源,第二步为了利益牺牲了安全 * 28:21 如果人工智能的终极势力抑或是“老大哥”要毁灭人类… * 35:18 比人类更聪明的东西一定会出现,有两种选择 * 37:56 Crypto和AI可以如何结合? * 41:13 如果我们行业就是发个币、做个交易所,这个行业是失败的 * 44:44 为什么以太坊生态或Web3生态依然没有实际应用? * 46:40 中心化的应用 vs 去中心化的应用(提到的产品名:Farcaster、Twitter、Warpcast、Firefly) * 53:30 如何看待Crypto行业中的投机分子? * 56:19 谈自己:生活、思考、恐惧 【更多信息】 本集文字版本:腾讯新闻原文 & 作者版本 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
最近美国大选尘埃落定,今天我们的话题不是美国政治,而是讨论一个地缘相关的科技话题:如果美国形成AGI霸权,我们应该怎么办? 这集嘉宾是李开复(零一万物创始人和CEO、创新工场董事长和CEO)。由于他有40年人工智能从业经历,曾经在苹果、微软和Google等科技巨头中担任高管,和中美各界联络广泛;这次,我们把话题推向了更为宏大的议题:AGI霸权与垄断、海外科技巨头的卡位与现状、AI超级应用的隐形崛起。 访谈中,他提供了一个如果美国有望形成AGI霸权,中国可以走的第二条道路的可能性视角。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 02:03 从2024诺奖开始聊起:聊聊我熟悉的Geoffrey Hinton * 09:19 Hinton的功劳不只是机器学习,还有识别GPU对机器学习的价值 * 10:20 23年开始的第一次也是最后一次创业:顶着“教父”、“偶像”这样的帽子创业,有包袱吗? * 15:17 24年零一最重要决策是做成本更低的推理,如何实施? * 27:36 做世界最牛的模型和做应用,是不能衔接的(Character.AI的两难) * 35:39 要追求第一个做到AGI且完全碾压别人,这个梦想我们没有,也不能有 * 41:25 第一个做出AGI碾压对手的,必然是商业霸权垄断者,会有成为终极垄断者的野心 * 43:03 中国可以走的第二条道路的可能性视角 * 49:43 我认可说AGI会7年以后会发生 * 54:11 谈零一最近的战略选择:2C先走海外,国内聚焦2B * 01:02:22 2C应用预计会在明年上半年爆发 * 01:04:45 智能助手可能走向委托式用户界面,变成Super App * 01:14:18 OpenAI还藏了很多牌,我们千万不要低估它 * 01:17:50 《Generative AI's Act o1: The Agentic Reasoning Era Begins》是标准硅谷共识 * 01:20:11 大模型公司为什么还要继续做预训练? * 01:23:40 为什么创业穿西装?“穿西装比较遮我的肚子” * 01:26:55 锐评海外巨头的卡位与挑战:英伟达、Meta、微软、OpenAI、xAI、Google(这里有很多增量:) 访谈中提到的文章: 《Generative AI's Act o1: The Agentic Reasoning Era Begins》(生成式AI的o1行动:代理推理时代的开启) 《Can AI Scaling Continue Through 2030?》(《人工智能的规模定律能否持续到2030年?》) 李开复推荐了三本书: A Brief History of Time(《时间简史》), by Stephen Hawking Leonardo da Vinci(《列奥纳多·达·芬奇》), by Walter Isaacson Man's Search for Meaning(《活出生命的意义》), by Viktor Frankl 【更多信息】 本集文字版本:腾讯新闻原文 & 作者版本 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
今天的嘉宾是知乎创始人和CEO周源。 可以说,大模型技术浪潮的崛起正冲击着现存内容社区的既有秩序。 拿知乎来说,有了大模型之后,当我们都可以向机器提问了,为什么还需要一个“向人提问”的产品? “向人提问”与“向AI提问”能在一个社区中共存吗? 更有甚者,倘若人类不再需要与另一个人类连接识别意义,这种人与人交流的平台,会不会最终被机器吞噬,成为机器理解人类的语料? 这不仅是知乎需要思考的,而是在AI技术变革面前,所有内容社区所面临共同的时代命题。 这集我和周源就聊了聊内容社区与AI。今年知乎上线了自己的AI搜索产品,知乎直答。周源对AI搜索、搜索引擎市场和Perplexity发表了一些特别的看法。 此外,我们也聊了聊一家内容社区14年的生存故事,以及它上市后的挣扎。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) AI、内容社区与Perplexity * 02:27 见到ChatGPT,第一感受是一股强烈的脱节感 * 05:29 我说要拿出1亿美元推动大模型,现在想来还是格局小了 * 06:50 早期几个判断:牌照制、开源、“人是AI的目的” * 11:38 针对大模型,知乎的投资决策(面壁智能)、产品决策 * 21:16 Perplexity更像一个内容产品 * 26:41 搜索引擎该被“颠覆”的地方都被“颠覆”好几轮了 记者周源和社区的核 * 38:09 站在报刊亭,觉得自己突然被慧星击中了 * 43:01 在媒体的面霸经历、撰文《桌面神话终结》基本被录用 * 45:20 “它可能是一个可以无限扩展的编辑部” * 49:04 第一段失败的创业(Meta搜索) * 49:50 30岁创办知乎的心情?你是谁?你想成为谁? * 54:24 知乎的内核是社区,社区的内核是什么? 与字节那场仗 * 56:01 字节当年做悟空问答?“我们做的可能不是一款产品” * 57:24 和字节那场仗结束的时候,你觉得知乎已经无敌了吗? * 47:58 “从搜索引擎进入到推荐引擎时代,推荐引擎的横向兼容性变得更大” * 58:38 在面对综合平台竞争的时候,有感觉到压力很大的时刻吗? 挣扎的本质 * 01:01:59 挣扎来自“评判标准的一致性” * 01:02:55 上市后知乎快速摇摆,战略上大起大落、大开大合,为什么? * 01:08:11 有评论说知乎水化,老用户声称要离开知乎,这是你不能接受的吗? * 01:09:00 知乎的股价就像坐上了跳楼机,你的心情是怎样的? * 01:12:32 知乎会认命吗?你会认命吗? * 01:15:51 海盗文化和“船长” * 01:16:31 孤独的悖论:“这个CEO还会在他该孤独的时候依然很孤独” 【更多信息】 本集文字版本:腾讯新闻原文 & 作者的收藏夹 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
受到万众期待又迟到2个月特斯拉Robotaxi大会,终于来了。但却以该公司股价下挫告终。这集节目我和孟醒在第一时间,逐字逐句点评了这场行业盛事。 本集是《张小珺Jùn|商业访谈录》和《技术不无聊》的串台节目。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 01:30 一场莫名其妙的会议?发布会时间还没延迟长 * 02:50 更像Party、年会,粗糙是特斯拉的常态 * 05:54 给特斯拉Robotaxi大会划重点 * 08:40 偷巧的用词:有监督版本FSD和无监督版本FSD * (FSD:Full-Self Driving,完全自动驾驶) * 13:30 马斯克说2025在得州和加州实现无人监督FSD? * 14:28 一周168小时,每台车一周使用10小时,如果车辆自动驾驶,使用率提升5-10倍——这更像共享经济的老故事 * 17:45 点评赛博出租车Cybercab:是Model2改造的? * 20:50 Model3的BOM成本12-13万出头,Model2的BOM成本10万以内 * 22:52 测试难度?封闭测试->固定路线开放场景->开放路线开放场景 * 25:20 算算账?马斯克预计,Cybercab运营成本降到20美分/英里,在美国包含税和其他费用的成本30-40美分 * 28:19 “牧羊人”、Car Partner、资金杠杆 * 38:54 特斯拉股价跌了、Uber股价涨了 * 39:41 到底为什么特斯拉要讲Robotaxi的故事? * 41:30 1亿量车、100吉瓦、分布式计算资源 * 43:05 点评无人驾驶多功能车Robovan * 47:45 点评整场唯一超预期的人形机器人:是摇操作? 【从蒸汽机到无人驾驶】系列 和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊 和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远” 从蒸汽机到无人驾驶3|和孟醒聊特斯拉FSD进化史 从蒸汽机到无人驾驶4|Waymo和它的对手们:我暗中考察了四个月 从蒸汽机到无人驾驶5|谈谈自动驾驶创投过山车这8年 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
我们的节目正在推出新系列【从蒸汽机到无人驾驶】,今天是第5集。 因为,在我自己学习自动驾驶的过程中觉得,这个行业的知识壁垒很高、信息不对称也很严重,所以邀请五源资本合伙人、前滴滴自动驾驶COO孟醒来做一个自动驾驶的深度科普。在之前的两集中,他分别以L2和L4自动驾驶为线索,分别聊了聊特斯拉FSD进化史和低调的Waymo及它的对手们。大家可以在《商业访谈录》的72集和74集收听。 今天这集更偏孟醒个人。这次聊天发生在他刚离开滴滴、即将加入五源资本的短暂间隔期之中。我们聊了聊为什么那么多人都在逃离风投,而他却选择在此刻回归?以及他所亲历的自动驾驶创投这8年。 建议大家把72、74和78这三期节目连起来收听。 本集是《张小珺Jùn|商业访谈录》和《技术不无聊》的串台节目。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 【嘉宾小传】 孟醒,五源资本合伙人、卡尔动力董事长,曾担任滴滴自动驾驶COO、顺为资本科技组负责人;在顺为期间,孟醒投资了小鹏汽车、Momenta等明星公司;加入顺为前,孟醒曾经作为创始人和CEO创办两家人工智能领域的明星创业公司,分别是美国的Orbeus和中国的知图科技,两家公司都被并购;孟醒还曾在摩根大通投资银行部门任职,负责亚太区科技领域的投资并购以及IPO项目,参与项目金额超过600亿美金。孟醒拥有加州大学伯克利分校应用数学和经济学学士,以及麻省理工大学斯隆商学院MBA学位。 * 创业和投资是一个旋转门 * 那么多人离开VC,我为什么在这时回来了? * 中美的孵化器对比 * 投资小鹏汽车、Momenta的经历 * 天使轮估值1亿美元以上的前沿科技公司还没有成功案例 * 16年通用汽车10亿美元并购Cruise带来了自动驾驶创投热潮 * 在创投端,亲历过去8年自动驾驶的起起伏伏 * 16年创立的自动驾驶相关公司到今天还活着的,大概一半 * 细说自动驾驶的产业版图和分工 * L2和L4领域今天已经高度头部化 * 经历多轮周期的自动驾驶能给今天的大模型哪些借鉴? 【从蒸汽机到无人驾驶】系列 和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊 和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远” 从蒸汽机到无人驾驶3|和孟醒聊特斯拉FSD进化史 从蒸汽机到无人驾驶4|Waymo和它的对手们:我暗中考察了四个月 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺jùn 更多信息欢迎关注公众号:张小珺
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧