播客: 张小珺Jùn｜商业访谈录 - EarsOnMe

播客简介...

努力做中国最优质的商业访谈。制作人张小珺曾供职《财经》杂志，现在是腾讯新闻科技主笔，一直写作关于中国商业的深度报道。范围包括科技、风险投资和知名人物报道。也许你看过我的作品： 2024年中国AGI三部曲《杨植麟复盘大模型创业这一年：向延绵而未知的雪山前进》《朱啸虎讲了一个中国现实主义AIGC故事》《王小川想提出中国AGI第三种可能性》抖音上下篇《抖音内幕：时间熔炉的诞生》《TikTok内幕：张一鸣的巨浪征途》共享单车上下篇《ofo剧中人：我不愿谢幕》《穿越废墟：共享单车剧未终》企业调查《百度最难捱的一夜：五名高管闪电辞职内幕》 VC与时代《风投，大转弯》《仅仅是昨天：我们亲历的萧条、繁荣和时代》《徐小平退后一步，方爱之向前一步：中国风投第一起交接故事》人物报道《王石：老人与海》《陆奇的大模型世界观》如果我的访谈能陪你走一段孤独的未知的路，也许有一天可以离目的地更近一点，我就很温暖：）

张小珺Jùn｜商业访谈录的创作者...

张小珺

张小珺Jùn｜商业访谈录的节目...

112. 和广密聊大模型季报：分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口

张小珺Jùn｜商业访谈录

在大家的强烈催更下，新一集的《全球大模型季报》终于来了。这一集有两个关键词。第一个关键词是分化。硅谷各个模型公司在这个季度，开始分化到各个领域，除了Google Gemini和OpenAI还在做通用的模型；Anthropic分化到Coding、Agentic的模型能力；Mira的Thinking Machines分化到多模态和下一代交互。第二个关键词是产品。《大模型季报》过去一直把视角放在模型的智能探索上，而广密开始浓墨重彩地聊产品，这还是第一次。这里是《全球大模型季报》的第7集，如果大家喜欢我们的系列，希望大家多多给我们一些鼓励和支持。你们的夸奖对我们来说，非常的重要。 2025，期待我们和AI共同进步！ 03:54 模型在分化通用各项能力的模型 - Gemini/OpenAI All in Coding+Agentic 能力 - Anthropic 多模态原生 - Thinking Machines Lab Grok 今天还在摸索自己生态位置 Meta 原创 0-1 的基因还是很弱最领先的这几家很像 F1 竞赛 21:37 横向全家桶，纵向垂直整合 C端是一个非常明显的头部收敛趋势，ChatGPT可能在C端会收敛掉很多产品作为投资人或 AI 创业者，一面兴奋是技术每个月都在进步，另一面有点绝望横向全家桶的例子是ChatGPT，已经包含了Chat+搜索+Coding+Agent+WorkSpace 纵向垂直整合的例子是 Gemini，从 TPU 芯片，到 Gemini 模型，到上面 Agent 应用，再到 Google 文档/Chrome浏览器/安卓操作系统/YouTube视频，可以做超级集成 33:35 智能和产品都重要过去 3 年一直是对智能上限的探索极度上头，但在过去两个月开始重视产品了 ChatGPT 身上有很多非技术性壁垒，而 Coding 或模型公司只是技术壁垒 OpenAI 是平衡最好的一家，一边探索智能上限，一边又把智能红利转化成产品流量和品牌心智 38:52 做 AI 产品很像挖矿，保鲜窗口很关键挖矿：第一个做出来让用户惊叹的体验很重要，哪怕 token 消耗很大，只要你是第一个做出来让用户惊叹的 Magic moments，就等于你起码得到了 5 亿美金的营销费用，比如 Perplexity/Cursor/Manus 但这个窗口期又特别有意思，窗口是逐渐在缩短的：从 2 年、1 年、3 个月产品公司能赢过模型公司做的产品吗？ 44:21 L4 级别的体验最优秀的俩 Agent 都有了 L4 体验：ChatGPT 的 Deep Research + Anthropic 的 Claude Code，分别对应信息搜索+软件开发今天最大红利还是 language/code 红利，尤其是 code，还不是多模态/世界模型/机器人 Claude Code 最近大杀四方，Claude Code 是一个 L4 的体验接下来还有哪些领域能有 L4 级别体验？ 52:43 对Google看法的转变一个猜想是，ChatGPT 后面肯定会做广告平台，因为最近招了新的商业化 CEO 但我在想 Google 还是全球最好的广告平台，最后大家产品形态上都会殊途同归，融合到一起的，就是全家桶逻辑，Search 也会演变 55:53 其他话题 AGI有泡沫吗？假如AGI有泡沫，什么事情会是导火索，戳破泡沫？人类和大猩猩的智能水平差异在哪？最近湾区有没有什么新的讨论比较高的话题？ “犹太人的金融，华人的AGI” 【全球大模型季报】系列 2023年：口述全球大模型这一年：人类千亿科学豪赌与参差的中美景观 2024年Q1：和广密聊AGI大基建时代：电+芯片=产出智能 2024年Q2：口述全球大模型这半年：Perplexity突然火爆和尚未爆发的AI应用生态 2024年Q3：AGI范式大转移：和广密预言草莓、OpenAI o1和self-play RL 2024年Q4：大模型季报年终特辑：和广密预言LLM产品超越Google之路 2025年Q1：大模型季报：和广密聊当下最大非共识、AGI的主线与主峰

69分钟

9k+

3天前

111. 李一帆口述激光雷达11年创业史：你仔细想行业的机会来自哪？是国家、民族的机会

张小珺Jùn｜商业访谈录

过去10年，中国新能源汽车产业从无到有，经历蓬勃发展。大家最熟悉的可能是理想、小鹏、蔚来这些整车品牌，但另一面这场变革背后的产业链企业也在变化。《商业访谈录》的108集对余凯和本集对禾赛联合创始人和CEO李一帆的3小时访谈，关注的都是汽车产业链上的隐形选手。这集也是李一帆对他们做激光雷达11年硬核科技创业的一部口述史。随着中国科技创新从互联网的模式创新，走向硬核科技的前沿创新，中国也许还会出现更多的技术型创业者。禾赛的故事也许能提供一个参考样本。（本次访谈录制于2025年4月） 00:02:00 开始的快问快答 00:02:33 股价过山车 00:03:40 激光雷达99.5%的降本 00:12:05 家庭和成长 00:32:13 罕见的3人平分股份 00:43:35 融资的伎俩 00:49:02 第一笔2000万大单 00:55:45 想说完蛋了… 01:10:06 余凯比多我一个0 01:20:47 定价心思 01:38:15 开始倒戈 01:58:07 进入汽车大本营 02:38:34 新钱和老钱 03:02:16 最后的快问快答【从蒸汽机到无人驾驶】系列《对李想的3小时访谈（播客版）：宅男、AI、家庭、游戏和天梯》《和何小鹏聊，FSD、“在血海游泳”、乱世中的英雄与狗熊》《对话奔驰全球CEO康林松：转型期CEO和转型之中的139岁奔驰》《余凯口述30年史：世界不止刀光剑影，是一部人来人往的江湖故事》《和楼天城聊聊Robotaxi和ACRush：“L2做得越厉害，离L4越远”》

188分钟

14k+

2周前

110. 逐段讲解Kimi K2报告并对照ChatGPT Agent、Qwen3-Coder等：“系统工程的力量”

张小珺Jùn｜商业访谈录

我们又来读论文啦！！！今天我们要读的论文是最近几个星期内最值得品读的几篇技术报告，分别是：Kimi K2、ChatGPT Agent、Qwen3-Coder的技术报告，以及Manus的一篇技术博文。他们的相关性是，这几篇内容都和Agent有关系。今天的嘉宾是俄亥俄州立大学（The Ohio State University）的在读博士郑博元，他的研究方向是Language Agent，他会带我们一起读上述技术报告和博文。这是《商业访谈录》的“技术之美”系列，期待和你一起读论文，领略科技平权，感受技术之美——做你的赛博组会：） 00:02:00 给Agent下定义和分类 00:14:50 Kimi K2、ChatGPT Agent、Qwen3-Coder、Manus的技术路线对比 00:28:29 Agent Training 的关键环节：合成数据、强化学习、安全 00:30:57 第一篇技术报告：Kimi K2: Open Agentic Intelligence github.com 00:43:50 第二篇技术报告和访谈：Introducing ChatGPT agent: bridging research and action openai.com 红杉访谈OpenAI：OpenAI Just Released ChatGPT Agent, Its Most Powerful Agent Yet www.sequoiacap.com 01:53:38 第三篇技术报告：Qwen3-Coder: Agentic Coding in the World qwenlm.github.io 01:59:04 第四篇技术博文：AI代理的上下文工程：构建Manus的经验教训（作者：Yichao 'Peak' Ji） manus.im 02:06:06 展望：也许会有一个新的范式 02:15:20 我感觉Agent是“我拓展的大脑”，我背后有一个“军团”（Family of Agents） 02:16:41 不同Bot的语言风格：DeepSeek嘴臭，元宝舔狗智能体定义 Agent是一种能够与环境进行交互（interaction）的智能系统。它具备两个基本能力：感知能力（Perception）能够观察环境的状态，包括获取外部信息、读取反馈信号、解析上下文等。行动能力（Action）能够在环境中执行动作，例如调用工具、生成输出、控制界面、修改变量等。简言之，Agent = 感知 + 行动在一个循环中不断执行“观察 → 决策 → 行动”的流程，以达成任务目标。 Agent 的定义与分类 1. Coding Agent（代码智能体）代表产品：Cursor、Windsurf 特点：代码生成与编辑能力强，用户体验优秀应用场景：代码补全、代码重构、多人协作编程 2. Search Agent（搜索型智能体）特点：结合搜索引擎，自动完成信息检索和汇总应用场景：市场调研、报告生成、竞争对手分析等潜力：在企业级场景中有很强的应用价值 3. Tool-Use Agent（工具使用型智能体）特点：能够调用多种外部工具完成复杂任务应用重点：是目前 Agent 研究和落地的主要方向举例：ReAct（推理 + 行动）类 Agent，通过 tool calling 执行任务 4. Computer Use Agent（电脑操作型智能体）代表产品：OpenAI Operator、Claude 的 Computer Use 特点：模拟人类使用电脑，完成跨应用的复杂操作应用场景：执行流程自动化、远程助理、办公代理 Agent 的技术路线对比 1. In-Context Learning（上下文学习）特点：依赖强大的预训练模型，通过提示构造实现任务规划与执行优势：无需微调，灵活性高局限：泛化能力弱，rollout 长度有限，容易失控 2. End-to-End Training（端到端训练）特点：将 Agent 的全部行为编码进模型权重优势：推理稳定，可控性强局限：训练成本高，环境构建复杂 Agent Training 的关键环节 1. Data Synthesis（数据合成）方法：生成大量高质量的 trajectory（行动轨迹）用途：训练 Agent 在任务中如何决策、调用工具、管理 memory（记忆） 2. Reinforcement Learning（强化学习）条件：需要定义清晰的 task（任务）与 verifiable reward（可验证奖励）挑战：任务难度与环境反馈设计直接影响 Agent 的行为质量 3. Safety（安全性）问题风险：Agent 具备自主决策能力，容易误用工具、走偏轨迹对策：加入 sandbox（沙盒）限制、行为约束机制、Human-in-the-loop（人类监控）展望：也许会有一个新的范式生成数据的核心会从 input-output 式的数据标注，转向构建 environment（环境）以及对应的 task-reward（任务-奖励）。比如 Scale AI 提出的 rubrics as reward（用评分标准作为奖励机制） Agent 能不能实现自我提升（self-improve）？一方面，Agent 在和环境交互的过程中会不断获得新数据；那它能不能自己找到或构造 verifiable reward（可验证的奖励）？交互中积累的 experience（经验），能不能被更有效地利用起来？

140分钟

17k+

3周前

109. 机器人遭遇数据荒？与谢晨聊：仿真与合成数据、Meta天价收购和Alexandr Wang

张小珺Jùn｜商业访谈录

今天又是一集机器人专场。嘉宾是光轮智能创始人兼CEO谢晨，他曾在英伟达、Cruise及蔚来汽车担任自动驾驶仿真负责人。我们的话题非常具体，即:仿真与合成数据。今天的具身智能尚且没有找到scaling law的有效配方，其中，数据是一个关键卡点。我们106集的嘉宾银河通用创始人王鹤就提到，真实数据在他们的训练数据比重仅仅1%，合成数据挑起大梁。今天这集节目，我与谢晨聊了聊仿真与合成数据的实操细节。 02:00 开始的快问快答 02:48 高频词汇解析：Sim2Real（从仿真到现实）、Sim2Real的gap、合成数据 04:31 从Cruise到英伟达到蔚来，怎么做合成数据和仿真？ 14:11 制作合成数据的具体流程？合成数据与真实数据的配比？ 16:17 在合成数据上，智能驾驶和具身智能的区别（智能驾驶是视觉的游戏，具身智能的物理交互最关键） 32:41 物理的Real2Sim（真实到仿真）工作流是怎样的？怎么评估成功的仿真？关键技术节点？ 46:18 Physical Intelligence（π）对仿真与合成数据的两难态度 48:55 辣评Meta 300亿美金收购Scale AI和极其aggressive的Alexandr Wang 53:57 合成数据目前面临的瓶颈 55:25 全球具身智能产业链Mapping：硬件公司（宇树）基座模型公司（π、Skild、英伟达和DeepMind）在垂域落地的软硬结合公司（Figure，特斯拉Optimas、The Bot Company）以仿真为中心做端到端落地的公司（光轮）（“特斯拉Optimas的管理文化和π完全不一样”） 01:09:22 美国存在具身模型层的创业机会，中国在我看来字节、小米、理想更适合做“大脑” 01:15:33 老黄在内部说：NV is a simulation company 01:21:25 终局的模型应该是是跨宇宙、跨世界、跨本体（提升跨宇宙的能力，本质是提升泛化性） 01:23:28 具身智能的产业还在GPT-1阶段，还没找到scaling law的配方 01:28:21 我创业刚开始，从具身的本科开始学起 01:37:37 最后的快问快答【机器人专场】逐篇讲解机器人基座模型和VLA经典论文——“人就是最智能的VLA” 和王鹤聊，具身智能的学术边缘史和资本轰炸后的人为乱象

101分钟

16k+

1个月前

> 全部节目

喜欢听张小珺Jùn｜商业访谈录的人也喜欢的播客...