111. 李一帆口述激光雷达11年创业史:你仔细想行业的机会来自哪?是国家、民族的机会

张小珺Jùn|商业访谈录

过去10年,中国新能源汽车产业从无到有,经历蓬勃发展。大家最熟悉的可能是理想、小鹏、蔚来这些整车品牌,但另一面这场变革背后的产业链企业也在变化。 《商业访谈录》的108集对余凯和本集对禾赛联合创始人和CEO李一帆的3小时访谈,关注的都是汽车产业链上的隐形选手。 这集也是李一帆对他们做激光雷达11年硬核科技创业的一部口述史。 随着中国科技创新从互联网的模式创新,走向硬核科技的前沿创新,中国也许还会出现更多的技术型创业者。禾赛的故事也许能提供一个参考样本。 (本次访谈录制于2025年4月) 00:02:00 开始的快问快答 00:02:33 股价过山车 00:03:40 激光雷达99.5%的降本 00:12:05 家庭和成长 00:32:13 罕见的3人平分股份 00:43:35 融资的伎俩 00:49:02 第一笔2000万大单 00:55:45 想说完蛋了… 01:10:06 余凯比多我一个0 01:20:47 定价心思 01:38:15 开始倒戈 01:58:07 进入汽车大本营 02:38:34 新钱和老钱 03:02:16 最后的快问快答 【从蒸汽机到无人驾驶】系列 《对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯》 《和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊》 《对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰》 《余凯口述30年史:世界不止刀光剑影,是一部人来人往的江湖故事》 《和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”》

188分钟
22k+
7个月前

110. 逐段讲解Kimi K2报告并对照ChatGPT Agent、Qwen3-Coder等:“系统工程的力量”

张小珺Jùn|商业访谈录

我们又来读论文啦!!! 今天我们要读的论文是最近几个星期内最值得品读的几篇技术报告,分别是:Kimi K2、ChatGPT Agent、Qwen3-Coder的技术报告,以及Manus的一篇技术博文。他们的相关性是,这几篇内容都和Agent有关系。 今天的嘉宾是俄亥俄州立大学(The Ohio State University)的在读博士郑博元,他的研究方向是Language Agent,他会带我们一起读上述技术报告和博文。 这是《商业访谈录》的“技术之美”系列,期待和你一起读论文,领略科技平权,感受技术之美——做你的赛博组会:) 00:02:00 给Agent下定义和分类 00:14:50 Kimi K2、ChatGPT Agent、Qwen3-Coder、Manus的技术路线对比 00:28:29 Agent Training 的关键环节:合成数据、强化学习、安全 00:30:57 第一篇技术报告:Kimi K2: Open Agentic Intelligence github.com 00:43:50 第二篇技术报告和访谈:Introducing ChatGPT agent: bridging research and action openai.com 红杉访谈OpenAI:OpenAI Just Released ChatGPT Agent, Its Most Powerful Agent Yet www.sequoiacap.com 01:53:38 第三篇技术报告:Qwen3-Coder: Agentic Coding in the World qwenlm.github.io 01:59:04 第四篇技术博文:AI代理的上下文工程:构建Manus的经验教训(作者:Yichao 'Peak' Ji) manus.im 02:06:06 展望:也许会有一个新的范式 02:15:20 我感觉Agent是“我拓展的大脑”,我背后有一个“军团”(Family of Agents) 02:16:41 不同Bot的语言风格:DeepSeek嘴臭,元宝舔狗 智能体定义 Agent是一种能够与环境进行交互(interaction)的智能系统。 它具备两个基本能力: 感知能力(Perception) 能够观察环境的状态,包括获取外部信息、读取反馈信号、解析上下文等。 行动能力(Action) 能够在环境中执行动作,例如调用工具、生成输出、控制界面、修改变量等。 简言之,Agent = 感知 + 行动 在一个循环中不断执行“观察 → 决策 → 行动”的流程,以达成任务目标。 Agent 的定义与分类 1. Coding Agent(代码智能体) 代表产品:Cursor、Windsurf 特点:代码生成与编辑能力强,用户体验优秀 应用场景:代码补全、代码重构、多人协作编程 2. Search Agent(搜索型智能体) 特点:结合搜索引擎,自动完成信息检索和汇总 应用场景:市场调研、报告生成、竞争对手分析等 潜力:在企业级场景中有很强的应用价值 3. Tool-Use Agent(工具使用型智能体) 特点:能够调用多种外部工具完成复杂任务 应用重点:是目前 Agent 研究和落地的主要方向 举例:ReAct(推理 + 行动)类 Agent,通过 tool calling 执行任务 4. Computer Use Agent(电脑操作型智能体) 代表产品:OpenAI Operator、Claude 的 Computer Use 特点:模拟人类使用电脑,完成跨应用的复杂操作 应用场景:执行流程自动化、远程助理、办公代理 Agent 的技术路线对比 1. In-Context Learning(上下文学习) 特点:依赖强大的预训练模型,通过提示构造实现任务规划与执行 优势:无需微调,灵活性高 局限:泛化能力弱,rollout 长度有限,容易失控 2. End-to-End Training(端到端训练) 特点:将 Agent 的全部行为编码进模型权重 优势:推理稳定,可控性强 局限:训练成本高,环境构建复杂 Agent Training 的关键环节 1. Data Synthesis(数据合成) 方法:生成大量高质量的 trajectory(行动轨迹) 用途:训练 Agent 在任务中如何决策、调用工具、管理 memory(记忆) 2. Reinforcement Learning(强化学习) 条件:需要定义清晰的 task(任务)与 verifiable reward(可验证奖励) 挑战:任务难度与环境反馈设计直接影响 Agent 的行为质量 3. Safety(安全性)问题 风险:Agent 具备自主决策能力,容易误用工具、走偏轨迹 对策:加入 sandbox(沙盒)限制、行为约束机制、Human-in-the-loop(人类监控) 展望:也许会有一个新的范式 生成数据的核心会从 input-output 式的数据标注,转向构建 environment(环境)以及对应的 task-reward(任务-奖励)。比如 Scale AI 提出的 rubrics as reward(用评分标准作为奖励机制) Agent 能不能实现自我提升(self-improve)?一方面,Agent 在和环境交互的过程中会不断获得新数据;那它能不能自己找到或构造 verifiable reward(可验证的奖励)?交互中积累的 experience(经验),能不能被更有效地利用起来?

140分钟
24k+
7个月前

109. 机器人遭遇数据荒?与谢晨聊:仿真与合成数据、Meta天价收购和Alexandr Wang

张小珺Jùn|商业访谈录

今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨,他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体,即:仿真与合成数据。 今天的具身智能尚且没有找到scaling law的有效配方,其中,数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到,真实数据在他们的训练数据比重仅仅1%,合成数据挑起大梁。 今天这集节目,我与谢晨聊了聊仿真与合成数据的实操细节。 02:00 开始的快问快答 02:48 高频词汇解析:Sim2Real(从仿真到现实)、Sim2Real的gap、合成数据 04:31 从Cruise到英伟达到蔚来,怎么做合成数据和仿真? 14:11 制作合成数据的具体流程?合成数据与真实数据的配比? 16:17 在合成数据上,智能驾驶和具身智能的区别(智能驾驶是视觉的游戏,具身智能的物理交互最关键) 32:41 物理的Real2Sim(真实到仿真)工作流是怎样的?怎么评估成功的仿真?关键技术节点? 46:18 Physical Intelligence(π)对仿真与合成数据的两难态度 48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang 53:57 合成数据目前面临的瓶颈 55:25 全球具身智能产业链Mapping: 硬件公司(宇树) 基座模型公司(π、Skild、英伟达和DeepMind) 在垂域落地的软硬结合公司(Figure,特斯拉Optimas、The Bot Company) 以仿真为中心做端到端落地的公司(光轮) (“特斯拉Optimas的管理文化和π完全不一样”) 01:09:22 美国存在具身模型层的创业机会,中国在我看来字节、小米、理想更适合做“大脑” 01:15:33 老黄在内部说:NV is a simulation company 01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体(提升跨宇宙的能力,本质是提升泛化性) 01:23:28 具身智能的产业还在GPT-1阶段,还没找到scaling law的配方 01:28:21 我创业刚开始,从具身的本科开始学起 01:37:37 最后的快问快答 【机器人专场】 逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA” 和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象

101分钟
20k+
8个月前

108. 余凯口述30年史:世界不止刀光剑影,是一部人来人往的江湖故事

张小珺Jùn|商业访谈录

今天的嘉宾是地平线创始人兼CEO余凯博士。 在过去49年人生中,他一路闯关过德美学术圈、中国互联网圈、创投圈、资本圈、汽车圈。在每个圈子和江湖,都从籍籍无名的无名小卒开始升级打怪。到最后,在每个圈子,他混得都不错。 一位与他打过交道的前企业高层评价,余凯是科学家里非常具有社会智慧的一位。 余凯毕业于南京大学和慕尼黑大学,毕业后,先后就职西门子、NEC研究院,于2012年回国加入百度,又于2015年离职创立地平线。 很巧的是,2025年正好是地平线创立10年。今年上半年,我与余凯博士聊了两次,这集节目是他的一部口述史。 随着大语言模型浪潮爆发,更多人工智能科学家从高校系统涌入创业轨道。余凯的创业观,也许能给大家一些启示——创业不仅是技术和商业,也不仅仅有刀光剑影,更是一部人来人往的江湖故事。 就像电视剧《少帅》张作霖的台词:“江湖不是打打杀杀,江湖是人情世故。” 2025年,我们和AI共同进步! 03:06 初入学术江湖 一开始在学术圈籍籍无名,算命先生说我24岁前“籍籍无名,劳而无功” 发表过100篇论文,我很陶醉,夜深人静都会翻我以前的paper自我欣赏 结识Geoffrey Hinton、Yann LeCun、吴恩达的故事 我这边的对面坐了一个人特别的沉默,没人搭理他,一个人在那吃闷饭——这个人叫Richard Sutton,前段时间拿了图灵奖 31:18 再入互联网江湖 我应该是旅美人工智能华人学者第一个回国的 我立刻就跟Geoffrey Hinton写信,他回信:Kai,挺好的,但你介不介意我也问一下其他公司? 我当时拿到的授权是,最高出到2400万美金,2400美金以后,每一次出价就要跟国内商量 我为了小概率能赢,抢先第一个出价,1200万美金 “哎呀,你看Geoffrey Hinton开会好像不太出现啊,他在干嘛…?” 我就问他:唉,Andrew(吴恩达)你在干嘛?各方面怎么样?开始试探他 吴恩达一下子震惊到了!说:你小子把我忽悠到百度,你自己跑掉,太不够意思了吧? 51:19 又入创业江湖 我做了3个投资:买了英伟达,买了特斯拉,全身心把我投到地平线 这个哥们跟我讲:兄弟,你知道吗?我现在在我家的地位,就靠你那句话! 地平线刚创立那一天我看了一下,英伟达才是一个107亿美金公司,现在是3万亿! 吴恩达在Google lead谷歌大脑,有一个frustration(沮丧)是什么?不能买GPU! 共识要么是错的,要么是没价值的 你的商业的secret是什么?有什么东西你看见了别人没有看见?这个世界是不是有Bug?这个世界是不是有通向未来的窄门,而大部分人没有关注到? 01:11:21 也入资本江湖 我们一页BP没写,就融了第一轮,我觉得:哎呀,Life is so easy! 结果第二轮就发现,见了50-60家机构,没一个下单。特别tough……没人理解…… 我说的简直是口干舌燥……地老天荒……昏天黑地……也没人动心 我定了一个铁律:我跟投资人第一次见面,绝不能在他办公室,一定要在我办公室 我继续装!我说:我真的没时间,我就是一个专注的、情商低的科学家,正在倒腾我自己的事情,懒得理你 我们创造了C轮业界传奇的12小轮,一把拿了16亿美金——这也是一个反共识——中间没有加1分钱估值 哇,地平线竟然有102家股东投资机构,我都不知道我怎么磕出来的 01:21:39 转战汽车江湖 科学家创业通常有这个问题:360度扫射 曾鸣那堂课上完以后,我们班好多同学回去都去砍方向、裁团队 有天晚上睡觉,我梦中突然一惊:我靠,这样不对啊! 和长安:故意输球,你们要优雅地、不露声色地、故意地输啊 和李想:李想在2019年初,我们俩爬山他讲:你应该聚焦汽车方向 和何小鹏:我现在还没有磕下小鹏————有的时候你要强攻,有的时候你要迂回 和王传福:我们逮着机会窗口,相当于这个门开一个小缝,咱们就呲溜一声冲进去 02:09:48 我不是江湖人 领导者我的role model是刘邦 电影这些角色,你知道我最喜欢谁吗?《飘》里的白瑞德 我的名字姓余,公司的名字地平线——余地,余地,做人做事永远要留有余地 智能驾驶:主机厂未来不会自研,它是一个标准化的功能 3年完成100%hands-off,5年完成100%eyes-off,10年完成100%minds-off 死门是什么? 机器人的CUDA 下一代芯片创新 02:35:23 最后的快问快答 这个世界我认为是写好了程序,每个人都是按照剧本来演 02:39:26 补充花絮 传授技巧:如果你决心离职,不要说公司任何不好 闫俊杰的发型像我(玩笑) 我和吴恩达在美国serious讨论过创业 我为了调一个校招生喝茅台,不像李想手起刀落 微信头像为什么关公? 【从蒸汽机到无人驾驶】系列 《对李想的3小时访谈(播客版):宅男、AI、家庭、游戏和天梯》 《和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊》 《对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰》 《和楼天城聊聊Robotaxi和ACRush:“L2做得越厉害,离L4越远”》 本集文字版:《对话余凯:世界不止刀光剑影,是一部人来人往的江湖故事》

177分钟
60k+
8个月前

107. 和梦秋的catch-up:创投挺无聊,也聊聊旅行读书和女性主义

张小珺Jùn|商业访谈录

这集没有宏大叙事,相当随性。嘉宾是清流资本创始合伙人、百度前技术VP梦秋。 关注《商业访谈录》比较久的朋友可能知道,梦秋基本每年都会来返场一次,和我们一起catch-up当下的创投水温以及她自己的生活。在狼性文化蓬勃的中国投资人圈里,梦秋一直是很佛系也很道家的存在。 这一集更是松弛,她直言工作挺无聊,所以在聊了正经话题以后,我们也聊了聊读书、旅行、观影和女生的碎碎念。 (本次节目录制在4月底) 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:00 2025年资本寒冬过去了吗?没… 04:00 DeepSeek的出现,让AI应用创业变得活跃了吗?没… 10:45 现阶段各种Bot的体验:神婆?舔狗?尤其点评微信、元宝和小红书 25:28 探讨一下,微信里怎么做Agent?通用Agent成立吗? 31:25 垂直Agent的创业机会和创业者 35:52 现在的组织倾向于小组织,这可能利好年轻创业者 37:42 为啥组织更小,融资额却更高了? 38:18 除了Agent,还在看的是具身智能(仿真器很重要) 43:57 可穿戴设备 54:54 大模型公司 58:31 这两年工作很boring,我的旅行之路 01:03:55 我的读书之路 01:12:34 聊影视行业(梦秋是中影独董)、《好东西》和女性主义 梦秋此前的节目: 《1. 和投资人梦秋聊聊加州、投资寒潮和林黛玉》 《21. 投资人视角下的大模型和市场真实水温|和梦秋聊ChatGPT》 《65. 风险投资的钥匙失灵了吗?和梦秋聊:蛰伏、更少人的游戏和啮齿动物》 【更多信息】 联络我们:微博@张小珺-Benita 更多信息欢迎关注公众号:张小珺

90分钟
15k+
8个月前

106. 和王鹤聊,具身智能的学术边缘史和资本轰炸后的人为乱象

张小珺Jùn|商业访谈录

今天继续《商业访谈录》的机器人专场,嘉宾是北京大学助理教授、银河通用创始人兼CTO王鹤。 王鹤毕业于清华和斯坦福大学。他给我们从“具身智能”的学术缘起开始聊起,这是一个学术流派从一个学科中萌芽到边缘再到主流渗透的全过程。 而随着ChatGPT诞生,“具身智能”这个小众概念,在过去2年成了新的资本宠儿——但一时间,也带来了新的乱象。 我们探讨了一些具身智能产业界关键问题: 1/具身智能起源于计算机视觉的学术流派,视觉、语言、智能的关系是什么?为什么VLM(视觉语言模型)的表现显著弱于LLM(大语言模型)? 2/具身智能的最大困境之一是数据采集,合成数据是正解吗?具体应该怎么做? 3/如果大模型提倡的是“智能即产品”,那么具身智能呢?王鹤的回答是“生产力即产品”。 去年底,英伟达创始人黄仁勋来华访问。答谢宴上,王鹤不仅和黄仁勋同桌,而且就在做黄仁勋旁边(挨着坐)。在节目最后,我们也聊了聊这个有趣的插曲——他提到,那晚黄仁勋吃了不少水煮肉片。 2025,我们和AI共同进步! 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 03:00 开始的自问自答 05:58 语言不是智能的本质,而是“一次跃变” “具身智能”和“机器人”是不同学术流派 “具身智能”起源于“计算机视觉”的研究流派 视觉有智能吗?纯视觉智能的可解释性差,是端到端的 语言不是智能的本质,不能说没有语言就没有智能 智能的本质是什么?“一种视情况对环境做出反应的能力” 语言是人类能产生这么高智能的“一次跃变” 视觉的本质是一种非常强的sensor(传感器) 25:08 具身智能的学术边缘史 具身智能最早兴起的task(任务)是,导航 加入视觉模态,强调Perception–Action Loop(感知-动作循环),成为具身智能研究流派能立起来的核心叙事 标志性事件:“具身智能是计算机视觉未来的三颗北极星之一”(李飞飞) 我和Skild创始人Deepak Pathak在Facebook人工智能实验室FAIR打过交道 41:15 我的学术之路 2016年,博士第一个项目:从人类视频里学多步的人与物体交互过程的生成(动画领域) 在Stanford博士第一年,在不喜欢的方向非常挣扎,后来换组、换方向 Stanford是高度自由的市场:你可以随时踢你老板,你老板可以随时踢你 第一篇论文憋了很久,很绝望 完全从视频中学习,学习世界模型,还没成为当下能推进具身智能的技术 我的第二个项目:位姿估计和合成数据相关 2020年李开复曾在湾区丽思卡尔顿组织brunch,观点分歧 回国坚定以家庭机器人为目标推进research,根本没有allies(盟军) 01:25:08 具身智能的软件和硬件是螺旋上升的问题 ChatGPT火了以后,很多人开始找我创业,我说创不了 所有工业机械臂在去年的全球总产值才1000亿RMB,和理想一家车企产值相当 如果采取不成熟的激进的硬件方案,对智能会是一种拖累 在这个硬件基础上,我们的方案是,做相对专用的智能和越来越通用的智能 VLM为什么显著弱于LLM?互联网视觉数据/所有人眼观测的覆盖〈〈〈互联网文字数据/人类所有说的话的覆盖(VLM数据不够,VLA的Action数据是最近两年才开始收集的) 01:44:34 我们要避免陷入以下泥潭 这一代具身智能公司相比此前机器人公司,差异在哪? 在我看来,具身智能公司如果陷入以下两个泥潭,天花板会很有限: 1、“长期漂浮”的公司;2、“算不过来账”的公司,边际成本不降 我们要做一个应用场景内的泛化(现在选择的是货架场景) 在我看来,机器人领域的头部效应很重 01:55:17 具身智能是,“生产力即产品” 雇人摇操采真实数据的成本到底有多高?一笔经济账 真实数据在我们训练数据的比重是1%,合成数据管线挑起大梁 行业内的tricky现象:把没有功能的机器人卖给别人(这是一种商业模式) 关于合成数据和Sim-to-Real(仿真到现实迁移)的常见误区 有出货量后的数据回流和数据飞轮 如果大模型是“智能即产品”,那么具身智能就是“生产力即产品” 02:13:51 资本轰炸后的人为乱象 谁在创造生产力,谁在讲故事,这是最乱的——这个源自美国 对Figure的估值400亿美元的两种逻辑 有的人胆子很大,不告诉别人我是摇操,但实际摇操 呼吁:真实展示!不要摇操! 5年内我们一定要有万台以上的应用,如果做不到这个,我们这个领域就被证伪了! 不要去搞一些砸我们行业招牌的事情!这些模式是很可怕的,是在砸这个行业的饭碗 通用机器人的到来不要想得那么快 02:25:25 一个插曲 去年黄仁勋访华为什么和黄仁勋同桌且在旁边?聊了什么? 黄仁勋能吃辣,吃了很多水煮肉片 02:28:26 最后的快问快答 【机器人专场】 逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA” 【更多信息】 联络我们:微博@张小珺-Benita 更多信息欢迎关注公众号:张小珺

158分钟
34k+
9个月前

105. 和奔驰王忻聊,产业大转折下的德国汽车、话语权和技术battle

张小珺Jùn|商业访谈录

《商业访谈录》访谈过很多中国新能源车企的CEO和高层,今天的嘉宾来自一家德国百年车企,他是奔驰中国自动驾驶与车联网研发负责人王忻。 我们聊了聊中国汽车产业20年变革的历程,以及一家德国车企的转型与秘密故事。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 产业大转型 01:25 20年前,就连波导手机也做过汽车 07:54 我曾在汽车Tier 1德尔福18年,3年前加入奔驰,背后是产业大转折 09:30 过去20年全球汽车产业的几个技术周期(2004年以前,2004-2014年,2014-2020年,2020年至今) 11:31 现在转变成数据驱动的时代,Tier 1黑盒交付的时代不再 话语权 27:40 中国团队和德国总部的话语权是争夺过来的吗? 28:27 奔驰中国研发团队组织架构、沟通机制和battle 34:08 德国企业的battle文化和美国企业是不同的 41:23 为中国设计生产的功能要反向输出全球的时候,需要哪些流程? 新技术 43:21 智能化是不可逆的趋势,但不能激进 46:50 车车通讯在L3实现以后需要重新定义 51:54 科技和豪华的关系:如果智能平权,豪华的标准变了吗 01:01:49 去年从规则算法切换到端到端的过程挺煎熬的 01:04:40 激光雷达是一个很好的冗余 01:05:35 CLA和豆包合作大语言模型 139岁车企 01:09:36 以人为本 01:11:08 安全的步骤 01:13:08 世界上第一位汽车驾驶员是奔驰创始人的太太 01:15:00 在百年企业工作是什么体验——荣耀是什么?负担是什么? 01:17:48 百年一遇的大转型、大变革 01:33:22 奔驰CEO康林松会发脾气吗? 相关单集: 对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰 【更多信息】 联络我们:微博@张小珺-Benita 更多信息欢迎关注公众号:张小珺

92分钟
13k+
9个月前

102. 和张祥雨聊,多模态研究的挣扎史和未来两年的2个“GPT-4时刻”

张小珺Jùn|商业访谈录

今天这集,《商业访谈录》第一次迎来一位co-host,是大家熟悉的李广密。 广密邀请了大模型公司阶跃星辰的首席科学家张祥雨,来聊聊,多模态的前世今生和未来技术的前沿走向。 张祥雨在这集节目详细阐述了:他参与的多模态的10年历史,对多模态的全新思考,以及所预见的下一个“GPT-4时刻”。 他提到一个细节:在训练过程中他曾经发现一件百思不得其解的现象——模型的通用对话能力、情商和知识量都是随着模型变大变得更强,但模型的推理能力(尤其是数学)表现却是先上升后平缓,再扩大反而是下降——这点在业界还未引发广泛讨论。关于这个怪现象,他也给出了自己的解答。 下面是广密和祥雨的聊天。 2025,我们和AI共同进步! 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 多模态研究的10年史:迷茫和转机 02:00 张祥雨的学术经历和个人研究主线 12:25 CV(计算机视觉)向NLP(自然语言处理)的学习历史 17:14 2022年我开始对单纯靠视觉学出“CV领域的GPT时刻”比较悲观 18:22 纯视觉这个domain有什么问题?GPT这样的生成模型你可以同时拥有生成、理解和人类对齐,而静态图像这三者是割裂的 24:23 我停止了对静态图像表征的研究,构思新的研究主题:短期内利用视觉和语言的对齐关系 29:10 经过尝试还是没做到图像的理解、生成和对齐一体化,我得到一个越来越强的生成模型,和一个越来越强的理解模型,没有起到叠加效果——为什么如此难以融合? 38:45 做了大半年十分迷茫,但在此刻出现了转机 训练大模型发现的怪事、蛛丝马迹与办法 41:11 训练过程中发现了一件百思不得其解的怪事:模型的通用对话能力、情商、知识量确实模型越大越强,但模型的推理能力(尤其是数学)表现是先上升后平缓,再扩大反而是下降 43:10 一些蛛丝马迹:更大的模型做数学题倾向于跳步,不老实 44:33 经过分析,这是next token prediction的本质缺陷 45:42 更大的压缩率未必对应更高的计算精度,我们来做一个思想实验 47:27 生成模型的“特征坍缩现象” 50:48 解决方案就是引入RL(强化学习) 53:28 o1的核心是思维链的pattern——“做思考模型,pattern is all you need” 01:01:52 当模型走到某一步,摆在面前有两个分支——走左边?还是走右边?——一个token之内到底能不能解决?(critical decision)——不能,所以引入反思pattern 01:10:16 o1范式的本质是一种Meta-CoT ,是CoT的CoT 对多模态研究的新思考和新进展 01:10:57 研究完o1,返回研究为什么视觉生成可控性这么差,就有了眉目 01:15:13 简单把生成和理解做到一起,难度非常大,缺失了重要一环CoT 01:15:54 去年中开启新的project:视觉理解(视觉空间的Long CoT) 01:19:06 尝试了半年,结果给大家透露一下吧! 01:21:30 o系列不仅泛化了domain,更吸引人的是泛化了pattern 01:22:16 博弈类问题是难以泛化的领域,有很多无效思考和低级错误 01:24:07 o1激发的反思pattern,在预训练语料中都有分布了 01:31:31 关于预训练加多模态数据有两种说法:影响了text智商?还是增强了scaling law? 01:36:43 往后两条腿走:扩充预训练语料和扩展动作空间 01:45:42 多模态的“GPT-4时刻”还有多久 预见下一个“GPT-4时刻” 01:46:56 long context和多模型协作 02:07:09 架构不重要,架构是服务算法和系统的(为什么我说Linear Transformer不本质) 02:08:30 下一个“GPT-4时刻”?模型的在线学习/自主学习 02:21:22 澄清一些有关Agent的观点 02:25:00 人虽然没有生成器官,但人有世界模型 02:26:34 我们的智能水平还在为视觉挣扎,机器人领域在抢跑 【更多信息】 联络我们:微博@张小珺-Benita 更多信息欢迎关注公众号:张小珺

148分钟
35k+
9个月前

101. 对YouWare创始人明超平3小时访谈:今天Agent像大猩猩刚拿起一根烧火棍

张小珺Jùn|商业访谈录

今天的嘉宾是明超平(小明/Leon),一名AI应用创业者。 2024年的AI叙事还是大模型,《商业访谈录》访谈了杨植麟、王小川、李开复等大模型公司创始人;稍一转眼,2025年的AI叙事已然变成应用公司和Agent——新的主角登场了。 这集节目和往期《对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量》一样,也是来自一线“AI应用爆发”、“Agent爆发”的前沿声音。 在中国创投圈,明超平是一位创业伊始就受到资本相对共识的创业者。他出生于95年,曾先后在OnePlus、ByteDance、Moonshot做产品。这是他第一次做CEO,发的第一个产品叫YouWare。 他和我们此前的两位嘉宾有一些渊源:一个是杨植麟,2023年他和杨植麟深谈了10个小时,从白天到黑夜,聊完决定加入Moonshot;另一个是肖宏,有时候我会听到创投业人士将小明与小红对比来聊,说他们都属于“Hands-on型、产品型创业者”。 是不是这样呢?今天的3小时访谈希望能呈现小明的真实状态,是不是大家说了算。 不过,虽然老被关联,小红与小明至今没见过。 期待2025,我们和AI共同进步:) 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 03:16 开始的快问快答 那些散漫的叛逆的挫败的少年成长 04:36 童年和少年片段 06:52 我在武大打辩论,尤其擅长四辩 13:00 辩论让我学会的最重要的:“永远具有第三方视角,辩论不是说服你的对手”,“1秒钟把自己变成傻子”(by张小龙) 14:40 大学后两年基本睡在实验室里,沉浸式打“智能汽车竞赛”,拿了国奖 19:43 哎,好惨,惨痛的经历——我是输掉比赛最多的队员,也是拿最佳辩手最多的队员 23:06 那是学长的退役比赛,我到今天还很愧疚 产品经理之路的前三站:OnePlus、ByteDance、Moonshot 26:37 产品经理之路第一站:OnePlus导师带我们去坐地铁、逛商场 30:18 “体验不是数据”:续航数据和续航体验不划等号,95-100%和0-5%电量是用户对体验最敏感焦虑的时候 33:58 产品经理之路第二站:刚去字节极不适应,觉得自己很菜 37:42 字节产品方法论劣势是什么?“它会磨灭掉很多灵光一现的创意” 39:35 “数据是‘开车的后视镜’,但它不能指引你前进” 41:03 字节没有乔布斯,字节没有张小龙,但字节有一鸣啊——有一些很小很小的创业团队,一鸣都聊过了 42:08 怎么看字节过去这些年出来了许多创业者,但无人大成? 43:28 23年和杨植麟聊了10个小时,聊音乐、艺术、爱好、产品、过去的经历,实在是到晚上8点我们要去吃pizza,我说“要不给我讲讲技术吧” 50:14 海外产品Noisee的走红与骤停 01:03:03 字节能成为字节,契合了时代几个重要变量(移动设备普及、带宽速度、推荐引擎) 跳下大船创业啦! 01:05:05 立马就遇到the bitter lesson(苦涩的教训) 01:11:59 想雕花的本能,情不自禁给它更多脚手架,你会和这个时代的最大变量背道而驰 01:12:45 突然意识到,这个东西不对劲——产品没上线就停掉了 01:13:18 失眠的顿悟:AI时代关键指标之一是“token消耗速度”,要追求“per token valuation” 01:16:33 “壳”被低估了,应该叫“容器”和“环境”(环境是人的反应器) 01:17:52 只给用户一个Chatbot输入框,是蛮不负责任的 01:21:18 今天Coding发展和当年Camera类似,早期聊相机说的是“拿着单反的人”,巨大变化是出现了新的人群——“手机摄影师” 01:23:50 早期趋势变量是出现新的人群,增速快,今天的新人群是“Vibe Coder(氛围编程师)” 01:25:23 今天Anthropic是不是承担索尼的角色?其他创业公司把时间花在Camera/基座模型上,还是花在——随着Camera迭代出现了Snapchat、Instagram、TikTok、TikTok Live 今天的Agent就像大猩猩刚拿起一根烧火棍 01:37:12 Agent未来可能的两种生态:类比新加坡vs美国 01:40:44 Page rank变成Agent rank 01:42:07 如果你把所有to C公司都变成to B公司,会受到大家的反抗 01:44:02 Agent的网络效应 01:46:02 我们也想成为OS Agent呀!——路径不告诉你:) 01:46:30 我对团队说:“咱们99.9%是要死掉的” 01:46:57 今天的Agent像一个大猩猩拿起石头开始砸东西 01:47:58 “永远相信Model会变好,永远相信Model和你无关” 01:49:50 基础模型在造更聪明的人,应用公司在通过环境/经验适用我们的生产需求 01:53:54 我设想的OS Agent:它是活的 01:58:26 Agent接下来会像人类社会出现部落,遇到信任问题,需要身份证、密码锁 02:03:33 过去2年对AI技术和产品的观察(以更高效的方式消耗token、压榨智能) 第一次做CEO 02:14:50 给你的员工提供情绪价值 02:19:53 90后founders更自信、更洒脱、更叛逆 02:21:17 融资风生水起,我却感觉如履薄冰 02:23:35 有意识地对抗Ego 02:33:45 棋手和对弈的人 02:36:57 最后的快问快答 相关单集: 和杨植麟聊大模型创业这一年:人类理想的增量、有概率的非共识和Sora 和王小川聊再创业这一年:回应朱啸虎与中国AGI第三种可能 和李开复聊聊:如果美国形成AGI霸权,我们应该怎么办? 对Manus创始人肖弘的3小时访谈:世界不是线性外推,做博弈中的重要变量 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺 更多信息欢迎关注公众号:张小珺

162分钟
32k+
9个月前

100. 对话奔驰全球CEO康林松:转型期CEO和转型之中的139岁奔驰

张小珺Jùn|商业访谈录

2025年3月底,奔驰汽车全球CEO康林松先生(Ola Källenius)来华9天,期间我对他做了一次访谈。 奔驰是世界上第一个发明了燃油车的公司,现在正处于奔驰139年历史上最重大变革时期,可以说康林松是主导这场关键变革的“一名转型期CEO”。 他1969年出生于瑞典,1993年加入了奔驰,绝大多数职业生涯都在奔驰;6年前,他在2019年担任了奔驰全球CEO。值得一提的是,他是奔驰历史上第一位在上任时非德裔的CEO。 我和康林松先生聊了聊他上任6年的重要战略决策(包括豪华车战略、电动化战略)、中国市场的成与败、科技平权与豪华车是否有悖论,以及在他领导之下的这场奔驰有史以来最重大的关键变革。 我想给大家呈现的是一个,转折之中的139岁巨人。 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) * 04:12 第一部分:谈中国市场 * 过去6年,你对中国市场最重要的观点是什么? * 你们在中国的市场份额过去3年一直下降,什么原因导致的? * 这是否意味你们在中国的电动车之战中,输了? * 你们更强调豪华车战略,而不是电动化转型,是这样吗? * 你喜欢中国汽车里的彩电、冰箱、大沙发吗? * 你们在中国市场的成败会决定全球转型的成败吗? * 计划采用哪些创新策略来扭转在中国市场的局面? * 18:24 第二部分:谈AI和新技术 * 外界说特斯拉在电动车上比你们领先10年,你如何回应? * 但如果你们无法控制所有技术,你们能控制自己的豪华车吗? * 随着汽车行业转向电动化和智能驾驶,奔驰没有完全引领这些新技术,奔驰还能主导豪华吗? * 你们正在测试固态电池,能否分享更多进展? * 人工智能将如何改变全球汽车行业的游戏规则? * 中国DeepSeek正在全球范围内崛起,你会考虑合作吗? * 随着“技术民主化”,技术不再是超级排他性,消费者还需要豪华车吗? * 如果必须在豪华和科技之间选择,你会选择哪一个? * 如果卡尔本茨先生还在世,你觉得他会选哪一个? * 40:17 第三部分:谈转型期CEO和转型之中的奔驰 * 拥有139年历史的奔驰巨头,如今正处于其历史上前所未有的转折点上? * 回到2019年5月22日,你接任首席执行官的那一天,那天都发生了什么? * 作为变革时期掌舵者,请说出你至今面临过的最大困境 * 特斯拉和中国车企仍然是创始人驱动,而德国汽车制造商经历了几代职业经理人,这是否会让德国汽车制造商更加保守? * 你有没有感觉过,这位139岁的巨人转型缓慢? * 当你做出每一个重大决定时,有没有觉得本茨先生在关注着你?这会让你有很大压力吗? * 如果能问卡尔本茨先生一个问题,你想问什么?

57分钟
10k+
10个月前

99. 对能量奇点创始人杨钊3小时访谈:人类驯服可控核聚变还有多少路程?

张小珺Jùn|商业访谈录

2021年,Sam Altman以个人名义向美国核聚变初创公司Helion Energy注资3.75亿美金,这是他迄今最大的一笔个人下注。Helion豪言称,将在2028年前建成全球首座50兆瓦聚变电厂。 马斯克持不同看法。他曾说:“我们的头顶一直就有一个取之不尽、用之不竭的核聚变反应堆——太阳”。他相信太阳能才是人类能源问题的根本路径。 不过,在许多人眼中,可控核聚变仍然是“能源界的圣杯”。 随着今天我们向AGI迈进,能源将是文明演进的最大瓶颈——毕竟,AGI或许不惧怕人类,但一定害怕断电。 这集节目,我邀请了中国可控核聚变创业公司、能量奇点创始人杨钊来聊聊。相比AI,可控核聚变是一条更漫长、更人迹罕至的创业之路。 它几乎是面对人类有史以来最复杂的物理难题之一,站在科技与人类文明的边界上,做技术摸索。 节目中,杨钊帮我们做了一次关于可控核聚变的前沿技术科普;作为中国可控核聚变事业的参与者,他也相对清晰地计算出了,人类驯服可控核聚变还需要多少资金要消耗?还有多少路程要走?我们也聊了聊,在更远处的未来,当能源成为无限,我们的世界、我们的文明又将怎样? 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 03:00 开始的快问快答 高频专业名词解释 04:10 核聚变、核裂变、可控核聚变、托卡马克、高温超导托卡马克,全世界只有3台全低温超导装置 13:22 多国联合推出的“国际热核聚变实验堆计划”(ITER), 一个超大型托卡马克装置,已投入资金250亿欧元,建设周期30年 14:47 高温超导材料和低温超导材料都是低温(高温超导在的能量增益的条件下,可以将装置体积缩小两个数量级,也意味建造成本大约缩小两个数量级) 19:17 一个关键指标:Q值/能量增益由三乘积(等离子体的密度×温度×约束时间)决定,Q值全球最高刚过1,目前追求Q>10 可控核聚变的历史 21:55 从爱因斯坦质能方程E=MC²开始说起,非常小质量损失会产生巨大能量 27:09 从氢弹到惯性约束到磁约束,不同磁场形状对应不同磁约束分叉技术路线 27:50 上个世纪60年代,苏联想到用甜甜圈一样的磁场位形托卡马克路线 28:50 全世界大概有100台以上托卡马克装置 29:11 从用铜做托卡马克的时代过渡到用超导做托卡马克 30:17 2024年,我们建成全世界第一台全高温超导托卡马克(“洪荒70”装置) 核聚变创业这4年 34:01 2021年想法:也许高温超导显著缩小装置体积,将成本两个数量级降低 39:43 想清楚以后搭团队,最开始4个人 41:05 杨钊的个人背景:斯坦福博士方向是比较底层的物理,量子引力、弦论、量子引力和量子信息的交叉,离这个世界比较远的基础物理 46:36 人类科学的“明珠”和“有生之年”系列 51:05 从博士毕业到核聚变创业之间?在金沙江创投美国做EIR(驻场准创业者)、第一段人工智能和音乐教育结合的创业 55:36 2021年初,针对核聚变科研院所和供应商的市场调研 “洪荒70”、“洪荒170”和经天磁体 59:37 “洪荒70”是怎么建造的?做一台全高温超导托卡马克需要几步? 01:07:33 每个环节都在不断出问题,你越接近实物状态,你的问题越大、问题越多,改动修补成本越高 01:15:43 “洪荒70”的意义 01:18:49 通往第一个可控核聚变商品的“三步走” 01:21:10 经天磁体(大孔径磁体)和“洪荒170”的意义 01:35:18 点评世界上3台全低温超导装置(中国合肥的EAST、韩国的KSTAR、日本的JT-60SA) 01:38:40 “洪荒380”,按照完整能长时间运行的示范电站的要求做 人类驯服可控核聚变还有多少路程? 01:41:40 Sam Altman迄今为止最大的一笔个人投资是Helion Energy:“磁场位形是直线性的,不像我们是甜甜圈” 01:45:06 核聚变和AI的关系是什么? 01:52:13 中美核聚变市场格局的分割与差异 01:54:10 我们和CFS(Commonwealth Fusion Systems,美国麻省理工学院分拆出来的联邦核聚变系统公司)技术路线是相似的 01:56:40 真正聚变商业化的原料需要用氘氘去发电,而不是氘氚 02:03:16 当能源无限,世界会怎么样? 02:04:57 聊聊自我与组织、登山与跌落 02:30:57 最后的快问快答 位于上海临港的能量奇点现场及装置图: (上图:公司外) (上图:厂房内) (上图:“洪荒70”建设中) (上图:“洪荒70”等离子体) (上图:“洪荒70”建成时刻) (上图:“经天磁体”) (上图:“经天磁体”的测试系统,“经天磁体”躺在大罐子里) 【更多信息】 联络我们:微博@张小珺-Benita 更多信息欢迎关注公众号:张小珺

154分钟
24k+
10个月前

98. 逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA”

张小珺Jùn|商业访谈录

今天的嘉宾是清华大学交叉信息研究院助理教授、星动纪元创始人陈建宇。他的研究和创业方向都是人形机器人。 大语言模型浪潮爆发后,学界和工业界看见了机器人从专用走向通用的可能迹象,机器人革命随之而来。其中,本轮革命最重要的是,对机器人底层架构,也就是机器人“大脑”的探索。 但通用机器人还在科学研究阶段,处于产业发展早期。这集节目,陈老师将带领大家,概览式阅读机器人基座模型和当下最前沿的架构VLA架构(Vision-Language-Action Model,视觉语言动作模型)的经典论文。 希望我们的节目能直观地帮助更多人靠近科学前线,感受技术之美,并且能直观感知当前技术拐点。 还是那句话:期待2025,我们和AI共同进步! (因为因为,陈老师真的分享了很多很多的动图和视频,本集结合视频服用效果更佳噢!可以前往:含投屏的视频版本。嘿嘿!预祝你学得开心!学得顺利啦!) 我们的播客节目在腾讯新闻首发,大家可以前往关注哦,这样可以第一时间获取节目信息和更多新闻资讯:) 02:30 陈建宇的研究和创业方向 04:11 讲解开始前,先提问几个小问题 17:36 当下最大变量:从专用模型到通用模型(robot foundation model)的可能性 21:12 大模型浪潮爆发后,机器人领域经历了两个阶段:从利用基础模型进行机器人研究(leveraging foundation models in robotics)到为机器人预训练基础模型(pretraining foundation models for robotics) 第一阶段:利用基础模型进行机器人研究(leveraging foundation models in robotics) 21:59 机器人传统三板块:Planning+Perception+Actuation(规划+感知+执行)——第一步,用LLM(Large Language Model,大语言模型)替代Planning 23:54 由Google Robotics团队提出的具身智能开创性论文Say Can《Do As I Can, Not As I Say: Grounding Language in Robotic Affordances》 (中文名:我能做到,而不是我说到:将语言与机器人的可供性相结合) 27:03 第二步,用VLM(Vision-Language Models,视觉语言模型)替代Perception 27:52 来自Google的论文《Inner Monologue: Embodied Reasoning through Planning with Language Models》 (中文名:内心独白:通过语言模型规划进行具身推理) 29:51 由清华和上海姚期智研究院提出的《DoReMi: Grounding Language Model by Detecting and Recovering from Plan-Execution Misalignment》 (中文名:DoReMi:通过检测和恢复规划-执行不一致来落地语言模型) 32:47 第三步,想把Actuation进一步自动化,用Code LM(专门用于代码相关任务的大型语言模型)来替代Actuation 32:24 由李飞飞团队提出的《VoxPoser: Composable 3D Value Maps for Robotic Manipulation with Language Models》 (中文名:VoxPoser:使用语言模型进行机器人操作的可组合3D价值地图) 第二阶段:为机器人预训练基础模型(pretraining foundation models for robotics) 38:36 VLA端到端模型(Vision-Language-Action Model,视觉语言动作模型)——“人是很智能的VLA Agent” 39:53 关于VLA的经典论文及分类: 40:17 Aloha论文《Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware》 (中文名:学习用低成本硬件进行精细双手操作) 47:36 Mobile Aloha论文《Mobile ALOHA: Learning Bimanual Mobile Manipulation with Low-Cost Whole-Body Teleoperation》 (中文名:移动ALOHA:使用低成本全身远程操作学习双手移动操作) 50:15 论文《A Generalist Agent》介绍了一个名为Gato的通用型人工智能代理 (中文名:通用型代理) 52:45 RT-1论文《RT-1: Robotics Transformer for Real-World Control at Scale》 (中文名:RT-1:机器人Transformer用于大规模现实世界控制) 59:02 Octo论文《Octo: An Open-Source Generalist Robot Policy》 (中文名:Octo:一个开源的通用机器人策略) 01:02:20 CrossFormer论文《Scaling Cross-Embodied Learning: One Policy for Manipulation, Navigation, Locomotion and Aviation》 (中文名:扩展跨具身学习:操控、导航、运动和飞行的统一策略) 01:06:58 字节跳动AI Lab的两个工作GR-1和GR-2: 《Unleashing Large-Scale Video Generative Pre-Training For Visual Robot Manipulation》(为视觉机器人操控释放大规模视频生成预训练模型) 《A Generative Video-Language-Action Model with Web-Scale Knowledge for Robot Manipulation》(用于机器人操作的网络规模知识生成视频-语言-动作模型》) 01:15:02 Palm-E论文《PaLM-E: An Embodied Multimodal Language Model》 (中文名:PaLM-E:具身多模态语言模型) 01:20:02 当前VLA最有名的开山工作:Google推出的RT-2论文《RT-2:Vision-Language-Action Models Transfer Web Knowledge to Robotic Control》 (中文名:RT-2:视觉-语言-动作模型将网络知识迁移到机器人控制中) 01:26:05 RT-X论文《Open X-Embodiment: Robotic Learning Datasets and RT-X Models》 (中文名:开放X具身:机器人学习数据集与RT-X模型) 01:31:16 《OpenVLA: An Open-Source Vision-Language-Action Model》(约等于开源版RT-2) (中文名:OpenVLA:一个开源的视觉-语言-动作模型) 01:32:56 陈建宇课题组《HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers》 (中文名:HiRT:利用分层机器人Transformer增强机器人控制) 01:38:40 Figure AI Helix,没发论文,但是今年Figure最新架构 01:39:28 Pi0论文《π₀: A Vision-Language-Action Flow Model for General Robot Control》 (中文名:π₀:一个视觉-语言-动作的流模型用于通用机器人控制) 01:41:36 英伟达最近发布的GROOT N1模型《GR00T N1: An Open Foundation Model for Generalist Humanoid Robots》 (中文名:GR00T N1:通用人形机器人的开放基础模型) 01:42:32 《Diffusion Policy: Visuomotor Policy Learning via Action Diffusion》 (中文名:扩散策略:通过动作扩散进行视觉运动策略学习) 01:47:39 清华发布的《RDT-1B: A Diffusion Foundation Model for Bimanual Manipulation》 (中文名:RDT-1B:双手操作机器人的扩散基础模型) 01:51:04 《Prediction with Action: Visual Policy Learning via Joint Denoising Process》(动作预测:通过联合去噪过程进行视觉策略学习) 和续作《Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations》(视频预测策略:一个预测视觉表征的通才机器人策略) 02:03:06 两个未来方向:《UP-VLA: A Unified Understanding and Prediction Model for Embodied Agent》(UP-VLA:具身智能体的统一理解与预测模型) 《Improving Vision-Language-Action Model with Online Reinforcement Learning》(通过在线强化学习改进视觉-语言-动作模型) 02:09:22 最后的提问 【技术之美】系列: 逐句讲解DeepSeek-R1、Kimi K1.5、OpenAI o1技术报告——“最优美的算法最干净” 逐篇讲解DeepSeek关键9篇论文及创新点——“勇敢者的游戏” 逐篇讲解DeepSeek、Kimi、MiniMax注意力机制新论文——“硬件上的暴力美学” 【更多信息】 联络我们:微博@张小珺-Benita,小红书@张小珺 更多信息欢迎关注公众号:张小珺

149分钟
26k+
11个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧