更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。 头图是 Dota 2019 国际邀请赛决赛(TI9)中,OG 战队的 Ana 使用 IO(小精灵,图中球形发光体)的经典作战,OG 在 TI9 中夺冠。为什么用这个图,播客里有答案~ 经过 “一切在加速” 的 2024 年,围绕中国大模型创业的讨论,从 “谁又融资了?” 变成 “谁会第一个倒下?” 行业分化时刻,我们访谈了中国大模型六小龙之一,估值已超 30 亿美元的 MiniMax 创始人兼 CEO 闫俊杰,聊了 MiniMax 的新技术目标,他们刚刚发布的首个开源模型系列 MiniMax-01 ,去年一年公司的变化和人员调整,以及闫俊杰作为一个“练习时长 3 年”的“新人 CEO”的自我复盘。 10 个月前,我们就访谈过一次闫俊杰。那次他提了很多字节;这次再聊,明显感到他主动提字节少了,提 Anthropic 多了。这与行业风向形成微妙的反差。 在他更在意字节的 2024 年 3 月,大模型创业最是烈火烹油。而现在,越来越多人开始讨论大厂对创业的压力,MiniMax 本来是看起来相对 “安全”:它的 AI 社区产品 Talkie 的最新月活用户数已超过 Character.ai,成为同类产品全球第一;其在中国的 AI 社区产品 “星野”,用户数、使用时长和留存率也都是第一,高于字节旗下的同类产品。 闫俊杰却自己推翻了这些优势,在他现在的认知里,用户数等指标并非 AI 竞争的核心,他说: - 千万别套用移动互联网的逻辑来做 AI。 移动互联网的逻辑是:用户越多,反馈越多,推荐算法越聪明。而闫俊杰认为,AI 大模型和产品的真实关系是: - “更好的模型可以导向更好的应用,但更好的应用和更多用户并不会导向更好的模型。” 在这个认知更加明确后,闫俊杰说他做出了取舍,现在 MiniMax 最重要的目标不是增长,也不是收入,是 “加速技术迭代”。 不到一年的两次访谈,我们从聊移动互联网到聊跳出移动互联网的逻辑,从讲 2024 年的目标到闫俊杰复盘当时定目标的逻辑就不太对——AI 行业和其中的人都在快速变化与迭代。 时间线跳转: ·聊 MiniMax-01 新模型系列:为什么开源? 02:12 为什么开源——加速技术迭代 & 加强技术品牌 08:22 行业误区:认为更好的智能水平要依赖更多的用户;其实不然 13:01 想清楚这个逻辑后:模型要追求不断提高上限,而产品就是产品 15:11 明确 MiniMax 是一家技术驱动的公司 ·聊对技术的态度:“一年前最喜欢说信仰的人,信仰都兑现了吗?” 18:01 “随热点而动?”这是对我们的误解 20:13 现在没人能定义什么是 AGI,只能定义智能水平会不断进步 22:00 作为创业者,不是说 Scaling Law 撞墙了我就放弃了,而是努力找方法延续它 23:59 一年前最喜欢说信仰的人,信仰都兑现了吗? ·聊 Agent:long-context 很重要,探索 coding 之外的 Agent 场景 25:31 Agent 能处理复杂任务,复杂任务指在专业领域达到专业人士水平 27:51 Agent 需要模型架构和能力的提升;MiniMax-01 做到了第一点 29:08 01 改传统 Transformer 里的非线性注意机制为线性注意力机制,提升了处理 long-context 的能力,这对单 Agent 交互质量,和多 Agent 通讯都很重要 35:07 为什么没发 o1 方向模型? 39:40 多模态能力在 OpenAI L1-L5 的 AGI 路线图里很重要 41:04 AI 编程助手 Cursor 的成功并不基于 o 方向的模型 41:51 蒸馏 o1 数据复现 o1,没那么难 44:09 编程之外另一 Agent 落地场景:信息的获取 51:09 中美模型的一个区别,前者缺少内部 benchmark 55:19 MiniMax 的技术团队特点:模型、Infra 和工程的综合能力强;客观、扁平、灵活 ·聊模应一体:市场不是有 A,就不能有 B 01:01:38 模型、应用一起做,还有必要吗? 01:03:59 即使更晚创业,也不会做只做应用的公司,因为想做基于未来技术的产品 01:04:44 海螺文本的失利——没有坚持技术驱动 01:06:48 Talkie、星野的暂时领先——因为更懂用户 01:07:34 做技术的人大部分觉得自己很牛,但我不是这么认知世界的 ·聊竞争:不要区分大厂和创业公司 01:07:56 不用把创业公司单独当一类公司 01:09:22 DeepSeek 也很纯粹;智谱第一个有 AI 路线图 01:09:59 MiniMax 的路线图?——逃出生天,下一步最重要 01:11:19 一年来大模型竞争最大的变化:更多人意识到这和移动互联网是两件事 01:12:29 没和字节谈过被收购,从来没想过把公司卖一个什么价钱 01:15:02 24 年没完成年初目标,定目标的逻辑就不太对 01:16:28 大厂投入和竞争激烈程度都在预料之内 01:18:46 AI 产品该看什么指标? 01:20:25 大公司之外,更大的“危险”还是来自自己的认知 ·聊团队和自己:放下 ego,深度思考 01:22:49 不要假定团队没有流失,流失才是正常的 01:23:24 MiniMax 需要的两种人 01:25:48 确定研发优先级需要做取舍,不见得每个取舍都对,纠错很重要 01:26:56 CEO 决策什么不决策什么不重要,重要的是组织有共同决策标准 01:29:48 让所有人都觉得公司被管得很好,这不是一个目标 01:30:28 打造 AI 组织的难点:持续吸引更好的人 01:31:17 半年多前焦虑,现在不了,因为已做出取舍,以技术迭代为最大目标 01:32:08 去年反思最多的问题——认知能力为何不能提升得更快? 01:32:16 放下自我,思考得更深入 01:34:29 为什么一直被叫 IO? 01:36:38 25 年对自己的期待:不断提高技术水平 相关链接: 《晚点对话 MiniMax 闫俊杰:创业没有天选之子》2025 年 1 月 《对话 MiniMax 闫俊杰:AGI 不是大杀器,是普通人每天用的产品》2024 年 3 月 MiniMax-01 开源系列模型技术博客 登场人物: 嘉宾:闫俊杰,MiniMax 创始人兼 CEO 主播:程曼祺,《晚点 LatePost》科技组负责人。小红书 @曼祺_火柴Q 即刻 @曼祺_火柴Q 剪辑:甜食 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章
「不再追求 AGI,他第一个讲了出来」 上周初开始,市场陆续出现有关零一万物的新调整传闻,关键词包括:“放弃预训练,资金链紧张、被阿里收购……”传闻出现的第二天,我们在零一万物办公地,中关村鼎好大厦,采访了李开复。 他解释了实际发生的变化:零一万物已经和阿里云成立了 “产业大模型联合实验室”,零一万物的大部分训练和 AI Infra 团队会加入这个实验室,成为阿里的员工,侧重超大模型研发。零一自己接下来会聚焦做更快、更便宜、更小,更能支持普惠应用的模型,同时自己做应用。 在李开复的描述里,超大模型和更快、更便宜、更小的模型的关系类似于“老师和学生”,超大模型可以通过标注结果和生成更多合成数据的方式帮更小的模型提升性能。 去年 5 月,我们也访谈过一次李开复,当时的话题是从中国“最年长的 AI 大模型创业者”开始的,在 2023 年创立零一万物时,李开复已经 62 岁。 和他行业地位还有人生阶段相似的人,更多会选择支持一个公司,而李开复这次是自己当 CEO,自己跳入了这场大模型的混战。 关于零一的新选择,有人认为是理性、务实,有人认为是收缩乃至“认输”。不管如何,在最新传闻后,李开复快速对外说明事实和阐释想法的姿态,展现了 CEO 的责任。当公司出现调整,CEO 是需要对内对外说明情况的人。 这次我又问了去年问过李开复的一个问题:功成名就时再来创业,会不会有心理包袱? 他的回答还是和上次相似。1983 年,李开复开始在卡耐基梅隆读计算机博士,当时他在研究计划里写:“AI 是人类认识并理解自己的最后一里路,我希望加入到这个全新绽放、充满前景的未来科学领域。” 李开复认为,这是他等了四十多年终于等到的 AI 时代,如果自己没有试一把,才是一个终身遗憾。 我们访谈李开复的两篇文字报道,我也贴在了 shownotes 的“相关链接”部分,感兴趣的听友可以阅读。 时间线跳转: 回应零一万物调整:“不会停止预训练,但不再追逐超大模型” 02:30 零一与阿里云成立“产业大模型联合实验室”,零一部分团队并入阿里 06:01 当开源追上闭源,任何公司没必要执着于自己预训练,但这件事现在还没发生 08:16 零一没有寻求过被收购 Scaling Law 在变慢;商业化灵魂拷问时刻已经到来 12:08 2024 年 5 月后,零一就做出抉择:聚焦更快、更便宜的模型;想做最大、最棒、最牛的模型,代价非常高,绝对不是一个初创公司可以做的事。 16:57 超大模型的作用是当 Teacher Model,提升较小模型的能力,Anthropic 和 OpenAI 都有类似实践 22:22 大模型时代,从技术竞争到商业落地拷问,一切在加快 25:13 不打打不赢的仗,不做看不到回报的大量投入 27:25 3 种 ToB 订单可以做:帮客户赚钱的;与行业客户紧密合作的;方案可复制性高的 “2025 年零一会有数亿收入”,怎么来? 33:32 2024 年获得超 1 亿元人民币实际收入 35:03 2025 年会和适合大模型的行业公司建合资公司,结合行业数据、Know-how 和零一的技术 中国大模型创业公司会全军覆没吗?——“没有任何概率” 38:26 谈团队变化:有人禁不住诱惑,有人想追寻超大模型 40:19 中国大模型创业公司全军覆没有多大概率?——“没有任何概率”,因为 AI-first 的应用会足够颠覆 44:01 AI-first 应用的特性:自然语言交互;有通用推理、理解能力;无 AI 不成立 45:11 中国大模型创业公司在应用和落地上会有更多优势,这是互联网和移动互联网验证过的逻辑。 “等了 40 多年,不试才是遗憾” 47:28 不后悔自己当 CEO,一线创业 49:43 2025 年,应用会爆发,零一会在垂直细分行业找到有大价值的 PMF 51:19 工作是工业革命留下的魔咒,如果有了 Super Agent,我会花更多时间和爱的人在一起,这是 AI 取代不了的。 52:45 “每一位都是勇士,我们应该彼此鼓励” 53:32 2025 年的新年愿望 相关链接: 《晚点对话李开复丨他第一个讲了出来,不再追求 AGI》(25.01) 《对话李开复:这次大模型创业,我十年都不会变现》(24.05) 登场人物: 嘉宾:李开复,零一万物创始人兼 CEO。 主播:程曼祺,《晚点 LatePost》科技组负责人。小红书 @曼祺_火柴Q 即刻 @曼祺_火柴Q 剪辑:甜食 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章
中国产品出海正在进入一个新时代:从卷低价、卷规格,到建品牌,讲故事。泡泡玛特希望在全球讲的是 IP 界的唱片公司的故事;名创优品希望借助每个大火的 IP,让自己的产品提供更多功用性之外的价值;喜茶则继续用联名,在全球范围内扩大自己的品牌影响力。 以往中国商品靠精益生产、快速周转,赚的是薄利多销的钱,今天新一代工厂管理者接手后,他们希望能从头搭建品牌故事、建立品牌影响力,利润空间更高、更具品牌忠诚度的海外市场就是他们心中的应许之地。但如何在海外从 0 到 1 搭建起一个品牌? 我请来了一位国际日化集团的社交电商负责人 Eric,这一集团下不少化妆品品牌女生们都耳熟能详, Eric 过去 10 年都在集团内负责整个亚太区域的电商业务,做过运营、投放、数据分析,Eric 很清楚一个品牌如何从头搭建、长大。 过去一年他开始转向出海,负责东南亚、日本、美国三个市场的 TikTok 电商渠道,中间踩了不少坑,也积累了不少经验,在本期播客中,我们将能够听到他的真诚分享。 东南亚市场 06:54 在东南亚,如何从0到1搭建一个海外品牌? 23:08 在东南亚做了一年 TikTok 电商,我踩了哪些坑 31:53 东南亚几个电商渠道,如何分配预算? 39:26 东南亚绝对不会出现李佳琦,因为没人会那么努力 日本市场 49:02 一个商品详情页要改两周,日本电商市场太慢 53:36 面对低效,破局的点是找到搭配默契的中国人团队 北美市场 01:00:46 品牌要在 TikTok 北美做起来,可能会面临哪些挑战? 01:06:43 雅诗兰黛等全球知名品牌是怎么做 TikTok 的? 01:08:12 为什么美国的 TikTok 很难像中国的抖音一样快速成长起来? 01:14:03 外资进入中国,有什么经验可借鉴? 01:18:41 出海过来人想说,你得考虑这三个问题 剪辑:甜食 登场人物 Eric,知名国际日化集团全球社交电商负责人,即刻 ID:艾瑞克丁 Eric 陈晶 《晚点 LatePost》记者,关注出海(Wechat:tiema233) 封面图:Eric 从印尼飞往越南的路上
「没进展的 5 年,也是内部技术变革的 5 年。」 两年多前,我们在 Robotaxi(无人出租车)的信心冰点报道过小马智行。那时的标题是:“市场不相信自动驾驶了,但他们还信”。 转眼到 2024 年:百度萝卜快跑 4 月在武汉引起热潮,Waymo 无人车队 8 月在旧金山的日均总单量超过了当地出租车(未计算网约车);年底,又有文远知行、小马智行两家中国头部 Robotaxi 公司先后登录美股。 在特斯拉和 Waymo 的路线对比中,强弱之势也正微妙变化。10 月,马斯克的 Robotaxi 发布会后,Uber 股价大涨 10%;而 1 个月后,当 Waymo 传出进入迈阿密,Uber 股价则跳水 10%。 谁更有希望代表 L4 真的改变人类司机出行网络?华尔街在用钱表态。 这个时刻,我们再次访谈了刚刚完成 IPO 的小马智行 CTO 楼天城。 他完整描述了小马过去 5 年 L4 技术变革:从 Learning by Watching 到 Learning by Practicing。 前者是学习人类驾驶行为的模仿学习,是如今 L2+ 普遍选择的路;后者的关键则是构造一个训练车端模型的虚拟环境,让系统可以自己进化,楼天城称之为“世界模型”。 楼天城分享了与之相关的多个技术洞察: ·世界模型本质不是一个模型,世界模型是车端模型的 factory(工厂),自动驾驶技术的真正差别在于 factory 的精度,而非车载模型的能力。 ·Learning by Watching 最多是像人,但像人永远无法做到 L4。 ·越是优秀的人类司机,学起来越是反向优化。 ·MPI 为 1000 公里的产品不存在,因为它反人性。 过去 5 年,外界看不到 L4 公司的明显进展:MPCI(接管里程)仍在提升,但只要无人化车辆没有大量上路,人们就没有直观感受,技术指标只是冰冷的数字。 但在楼天城的叙述里,外界见不到进展的 5 年,也正是关术变革发生的关键时期。 这些变化,使 Robotaxi 今年得以启动百台至千台级别的规模化运营,也给行业带来了高开低走,又逐渐反弹的波折命运。这不仅考验从业者的理性技术判断,更考验感性的决心,和说服团队一起相信的能力。 “我一直说,大部分人不能坚持不是因为太苦,而是因为受到了诱惑。”楼天城说,过去 8 年,他没有遇到过能和自动驾驶相提并论的诱惑,大模型也不算。 时间线跳转: ·5 年前:瓶颈 →绝望→寻找新路 02:53 2019 年后,L4 的进展难再被感知,规模化无人运营带来了市场水温变化。 11:13 这 5 年:从 Learning by Watching 到 Learning by Practicing 12:30 前者是模仿学习,没法学习驾驶员怎么想 14:27 世界上不存在一个 MPI 为 1000 公里的 L2 产品,因为反人性 16:13 模仿学习的另一个问题是人的双标,AI 司机所以像人依然不满足需求。 19:07 学习优秀司机也不行,甚至是反优化 19:45 这本质是因为模仿学习是开环训练,“我绝望了,才发现闭环是出路” ·搭建“世界模型” 22:03 Learning by Practicing 的闭环训练,是强化学习思路 23:46 学了棋谱再强化(AlphaGo),甚至不如直接从 0 开始强化(AlphaZero) 24:28 感性上的挑战:之前的路线做了 3 年还不错,换路线后前两年追得痛苦 26:19 5 年前开始转向以生成数据为重,这也是世界模型的任务之一 30:36 在虚拟环境里学习,本质是“向未来的自己学习” 32:21 世界模型是车端模型的工厂,自动驾驶进化的关键是工厂的精度,而不是车端模型本身 34:43 Learning by Watching,数据和算力是关键;Learning by Practicing,世界模型的精度是关键 ·认为 L2 会覆盖 L4,是还没有越过分界点 35:03 没有谁做了错误选择,L2+和 L4的优化方向不同 36:18 L2 使用 Learning by Watching 没问题,也符合 L2+的规模效应特性 38:51 L2 不能覆盖 L4,L4 也不能取代 L2,真正越过分界点后会发现这是两件事 42:20 小马世界模型的构成:1.数据生成器 2.驾驶评估体系 3.高真实性的仿真 4.数据挖掘引擎 45:39 魔鬼在细节,世界模型的细粒度指标是核心竞争力 53:04 世界模型的终极状态:车不再因错误发生事故 54:48 千台 Robotaxi 开始有毛利,净利和扩张则是策略上的 trade off 56:15 不会因为它是特斯拉,Learning by Watching 就能 work 01:03:11 车辆运营维护与合作伙伴一起做;远程遥控人员的比例未来可到 1 比 30 ·大部分是因为结果的正确,倒推方法的正确 01:10:20 大部分人不能坚持,不是因为苦,而是因为受到了其它诱惑 01:11:08 大模型现在很 fancy,一旦走到应用阶段,会经历自动驾驶经历的所有事 01:11:35 MiniMax 的产品是 L4,CoPilot 是 L2 01:14:09 度过行业起伏:外界看不到进展时,内部也要有合理且可感的里程碑 01:17:30 越来越相信,世界是模拟的 01:19:40 大部分人是因为结果正确,倒推成功者方法正确,但正因如此,不该盲目套用别人的方法 01:24:00 过早追求商业化,和一定要追求最有价值的商业化,都是极端。“创业前我没想过二者的平衡,创业中我肯定偏执过。” 01:25:57 下一步的关键是合理成本下,扩大车队规模 相关链接: 《市场不相信自动驾驶了,但他们还信》 剪辑:甜食 登场人物: 楼天城,小马智行联合创始人兼 CTO。 程曼祺,《晚点 LatePost》科技报道负责人。
汉洋和工业设计师志斌一起聊了聊到底啥是工业设计?并且随机点评了一些当下比较火的产品。 本期节目我们聊到了: * 简单一句话 20 来个字概括工业设计 * 工业设计这门课本科都在学啥 * 哪个最不起眼的东西实际有很高的工业设计含金量? * 工业设计和其他设计的区别和联系 * 工业设计师是一个工业产品的产品经理么 * 工业设计在一个产品线中所处的环节是什么? * 工资最高和最少的工业设计师分别在设计什么(或者说在解决什么问题) * 比如说你看到一台新发布的手机,你会关注什么? * 顺着聊聊,如何看待 iPhone 的设计? * 不同产品之间你关注的设计点一样吗?比如车和手机 * 聊聊理想 Mega * 那些细节是你一看就难的,但普通人都感觉习以为常的? * 反过来呢?大家认为难但实际上很简单的呢? * 没做过工业生产的老板,会在设计上踩什么坑? * 我们拿到一台新设备,该怎么看他的设计好坏? 相关链接: 志斌的播客《荒野楼阁 WildloG》(苹果) 《荒野楼阁 WildloG》(小宇宙) 预言在应验:五年前所讨论的未来人机交互的新范式_6.ylo 志斌的 blog 柳宗悦 登场人物: 志斌:一个家里有动物园的设计师奶爸 汉洋:设计溜达动线中 后期:甜食 封面:志斌在拍照
具体信息可以点击这里查看。 发邮件到 why at gailiuzi.xyz 就可以。
「稿件操作幕后,文字之外的更多想法和碎碎念。」 本期的主播是曼祺,很高兴和「十字路口 Crossing」串台,一起来聊《晚点》11 月底发布的一篇文章《中国大模型生存战:巨头围剿,创业难熬》的操作故事和感受,这刚好也是一次大模型创业的年底“非系统”复盘。 这段时间,我感受了非常不同的 AI 面向:先是参加了十字路口和 Abotify 一起组织的一场 AI 创业和开发线下活动(1000 天后的 AI 世界),本来 150 人的活动,有 700 多人报名,最后我目测现场涌入了 200 多人;热火朝天和甚至“乱哄哄”的现场交流与碰撞,是如今的 AI 拼图之一。 而这前后,我们为准备大模型稿件做采访、数据整理和撰文时,又看到了拼图的另一面:字节等大公司来势汹汹,后来居上,它的大模型进展在 23 年下半年还被群嘲,如今已不可小觑——“中国的大象真的会跳舞”。最头部的一批创业公司,尤其是既做模型,又做应用的六小龙无不感受到这只“大象”的压力。 所以我们后来在年底的大模型创业生态稿件中,选择了这样一个主线:“巨头围剿,创业难熬”。本期就是和 「十字路口」一起聊聊这篇稿件的操作,以及更多报道之外的言外之意和“前排感受”。 「十字路口」的两位主播带来了和不同的视角:Koji (杨远骋),联合创办了街旁、新世相和躺岛,他自己现在也在做 AI 应用,是一位活跃的 AI 开发者,对各模型性能区别和 AI 应用的快速变化有一手观察;Ronghui,目前在一家专注科技投资的风险投资机构工作,之前是第一财经周刊驻硅谷的记者,她所在的机构也在积极投资 AI 项目。 时间线传送: Part 1 大模型创业变局:核心变量仍是技术进化的方向与速度 02:33 市场的核心分歧:技术进化的方向与速度? 04:35 if 进化快:也许有创业者能有一定的认知优势 & 模应一体也会更合理 08:16 if 进化慢:产品能力变得更重要 & 大模型头部公司融资不顺 10:00 神奇的 DeepSeek:不是大厂,但资源够多 11:55 不管进化快慢,开源对闭源都有压力 14:44 三种反馈:共鸣、中外关注差异、具体数据讨论 20:23 马云训话阿里投资部的段子背后 21:31 不是创业公司不顺利,是大厂衬托下显得不顺利 23:49 六小龙现状:Kimi 专注做 Kimi,零一不是没产品,智谱 AutoGLM 与手机合作 31:15 Kimi VS MiniMax:前者重注生产力,后者推出更多适应性产品;生产力是大公司的必争之地,MiniMax 星野、Talkie 在细分市场暂时比大厂产品更强 35:50 闫俊杰说追求 Intelligence with everyone;杨植麟说追求智能极限 44:34 大模型创业,一年花费到底多少?投资人的算法 VS OpenAI 花费 47:33 大模型创业公司不是面临一个挑战,而是一组纠缠的挑战 48:40 今日头条上线 1 年多时,就有 1000 万日活 Part 2 字节如何后来居上:招人才、定策略、建组织 52:13 字节在大模型上不如中国其它大公司,百度才是最早的 56:41 去年到今年,直接的变化:一号位亲自招人,确定自己做、不再对外投资,Flow 的成立 01:01:15 字节做 AI 的外部变量:海外的地缘压力 01:02:19 阿里的新战略:AI 驱动、公共云优先;未来的新看点:阿里云 VS 火山云 01:07:02 腾讯,可以后发制人 01:08:40 百度的组织张力,萝卜快跑反而成了百度今年的 AI 亮点 Part 3 应用在蓬勃生长,创业者没空悲观 01:11:45 十字路口xAbotify 线下活动,100 多名额,700 多人报名 01:12:44 超级个人+小团队的蓬勃发展 01:15:28 应用没有爆发?还是预期太高? 01:16:20 好用 AI 应用的例子:Recraft、Cursor 01:20:00 创始人没空悲观,他们一定在寻找出路 01:21:24 “战争不是由拼搏组成的,而是由等待和煎熬组成的。” 相关链接: 我们办了一场全程高能量的 AI 创业者聚会 中国大模型生存战:巨头围剿,创业难熬 大厂大模型:久违的一把手工程 晚点独家丨月之暗面探索 o1,跟字节抢来华为刘征瀛 晚点独家丨大模型六小龙第一起分拆:零一万物计划独立 AI 游戏公司 晚点独家丨月之暗面收缩出海,相关产品负责人离职创业 登场人物: Koji 街旁、新世相、躺岛联创,@即刻 杨远骋Koji Ronghui 美元 VC,前《一财》硅谷记者,@即刻 Ronghui 程曼祺 晚点科技报道负责人,@即刻:曼祺_火柴Q 剪辑:十字路口团队 播客封面:《星球大战外传:侠盗一号》 关注《晚点 LatePost》公众号,阅读更多商业、科技文章:
和更多出海创业者、投资人交流后,我有个直接的感受,“不出海、就出局”这种言论是在给创业者们制造焦虑。 很多创始人没有足够认真地思考过,自己的产品是否适合卖到海外、努力投入几年后可能还不如做好国内市场、自己应该加强哪些方面的能力,以及,如果你还需要融资的话,投资人真正关心什么。 这期节目,我们邀请了云时资本创始人彭创,来聊聊从投资人视角看,什么样的出海项目更值得投资,出海创业者们身上有哪些优势和局限。 彭创在创立云时之前,是洪泰基金的管理合伙人、高瓴资本投资副总裁、高瓴旗下清流资本合伙人,投资过 51 信用卡、有赞等项目,现在云时主要看出海,覆盖材料/零部件、软件、智能硬件、自动化/装备、互联网五个方向。 创始人决定是否出海前,应该思考哪些问题?一起来听一听投资人视角的看法。 出海创业者们的优势、局限和纠结 00:01:44 以前投有赞、51 信用卡等互联网项目,我是如何从互联网到非洲,再到出海? 00:07:16 从无人问津到所有人都在谈论,投资人看出海的视角有什么变化? 00:11:41 从投资人视角看,中国出海创业者局限在哪里?怎么补足能力? 00:19:32 想要做品牌的出海创业者,应该向安克学习什么? 00:24:20 出海创业者们的犹豫、纠结,很大程度来自全球局势的不明朗 00:26:58 “不出海,就出局”是在制造焦虑,怎么判断自己的业务到底适不适合出海? 作为一家主要投出海的基金,如何构建自己的投资逻辑 00:36:54 投资人能投的出海方向,选择已经不多了 00:39:08 什么样的出海创业公司,投资人会更感兴趣? 00:49:10 从零到一,如何搭建起来一个双币基金? 00:51:29 募资越来越难了,但本质上是因为曾经的资源错配了 00:55:42 给还在一级市场,迷茫的年轻人们一些建议 登场人物: 彭创 云时资本合伙人 陈晶 《晚点 LatePost》记者,关注出海(Wechat:tiema233) 剪辑:甜食
「大家都是牛马,凭啥你加夜草」——轶轩 和节目的老朋友丰泽聊聊人活着有啥意思,可以算是和王小伟老师那期《每个人活着都难受》那期的另一个版本。大部分问题想清楚很简单,想开了很难。意义的神圣感和吃饭喝水一样,是人的刚需。人活着有啥意思不是个虚无缥缈的问题;尤其是当代社会充斥着各种各样的「以工代赈」,工作意义早已被掏空。但人的价值不(光)是靠工作体现的。评价指标出了问题,不是人出了问题。 相关链接: 每个人活着都不舒服 圣山与山 没有签证怎么去非洲干活:和丰泽聊聊在非洲不同国家打灰的体验 是理想也是现实:一个清华博士的非洲选择|文化纵横 登场人物: 丰泽:海洋于他们而言如同河流 汉洋:现前一段西来意,一片西飞一片东 后期:甜食 封面:烟火,汉洋拍摄于日本
汉洋和重轻借着聊小红书,谈了谈游戏社区这件事。但这期节目的内容可能和你想的不一样——他俩没有聊游戏社区是什么,而是就着游戏社区谈了一个更大的问题:游戏是如何从一项简单的娱乐活动,变成了生活本身?并且接着游戏社区这个话题,分析了一下到底什么是社区。不过因为这期节目录制的比较早,所以没聊到黑神话。 这期的 shownotes 里没有时间节点,是因为这期节目整体上就是一场逻辑推演。每个环节之间都有上下文语境之间的关系。 本期节目聊到了: 1. 这期节目是怎么来的 2. 作为一种出版物的电子游戏 3. 游戏的消费方式 4. 早期只有资讯,没有社区的游戏 5. 关键问题,游戏如何演化成了⽣活的⼀部分? 6. 关键线索一:从买断制到持续运营 7. 关键线索二:更多的消费方式 8. UGC 基础设施的普及 9. 社会生活的底层逻辑 10. ⼀转眼,社区远⼤于游戏游玩 11. 到底什么是社区? 名词解释: UGC:用户生成内容 相关链接: 汉洋关于小红书的文章《小红书的造梦都市》 为了写文章弄的美妆号(不咋更新) 小红书账号:汉洋在拍照 如何获得快乐:与重轻唠唠游戏产业的科普 按下快门,记录镜头下的沉玉谷绝美景色! 风男们跳magnetic😱🙌🏻!!! 【原神无UI】无缝转场,极致丝滑 痛耳机:全网首个魈宝痛耳机 自制散兵联名特饮:买不到?无所谓,姐教你自己做! Has Genshin Impact Ruined Conventions? 恋与深空与猫 绝区零模仿小红书的桥段 登场人物: 重轻:播客《不在场》主理人 汉洋:朋友你关注我小红书了吗? 后期:甜食 题图:汉洋的猫在看游戏
GPU 算力总消耗会提升,但暂时有冗余;AI 应用开发热情未冷却,只是不被 VC 关注。 今天的节目是一期加更,我们在 OpenAI 最新模型 o1 发布后的第二天,邀请了硅基流动创始人袁进辉与我们讨论了 o1 这一新进展,也分享了今年 1 月至今,袁进辉观察到的 AI 开发者社区的变化。 上次袁进辉做客《晚点聊》是今年 1 月,那时他刚开始新一次创业没多久,选择做服务 AI 开发者的推理(inference,即大模型的使用)加速和优化。 OpenAI o1 的一个重要新特性,正是从扩大 train-time compute 的规模到扩大 test-time compute(见下图,来自 OpenAI 官方博客),即通过在推理阶段分配更多计算资源提升模型效果——也有人称之为从 train scaling laws 到 inference scaling laws。 英伟达 AI 科学家 Jim Fan 说,这可能是自 2022 年 DeepMind 提出 Chinchill Scaling Laws(原版 Scaling Laws 上的一个优化)以来,大模型研究中最重要的一张图。 总结而言,o1 打破了一个预期:过去在大语言模型范式下,模型在解决推理逻辑问题时遇到了瓶颈。而 o1 通过强化学习(Reinforcement Learing,也被简称为 RL)、思维链(chain of thought)和测试时间计算(test-time compute)显著提高了模型的逻辑推理能力,所以在科学、数学和编程等需要更多逻辑能力的任务上表现大幅提升。 这期播客里,袁进辉比较通俗地解释了强化学习、思维链,还有 test-time compute 是怎么发挥作用的。我们也讨论了 o1 的这些新技术特性对算力消耗量,行业应用还有其它 AI 公司的动作可能有什么影响。 节目后半部分,我们进一步讨论了 AI 开发者生态这一年的变化。与很多人的观点不同,袁进辉说,在应用开发端,他没有感到 AI 热潮的冷却,只是现在涌现出的很多开发者是小微企业甚至是个人开发者,他们不在传统 VC 的视野里。所以一方面,创投市场会觉得 AI 应用的爆发不如预期,另一方面,实际调用量也在快速增长。 他还分享了一些一手数据:比如硅基流动自己的客户,调用最多的开源模型,国外是 Meta 的 Llama,中国则有阿里巴巴的通义千问和幻方的 DeepSeek,千问的优势是不同规模的模型版本齐全,而 DeepSeek 则在编程能力上突出。 时间线传送: ·o1 的“Wow”在于突破了大模型方法下的推理能力瓶颈 02:56 o1 发布,兑现了之前已被逐步释放的高预期 03:57 模型三重能力:语言、常识、推理,前两者之前已做得比较好,o1 提升了第三点 05:25 “弱智吧”是大模型试金石? 06:35 同样使用强化学习,AlphaGeometry 关注度为何没有 o1 高?——强化学习本身不新了,Alpha 家族的 Wow 时刻已经发生,o1 的进展是打破了大语言模型推理弱的预期 10:28 o1 新方法:强化学习、思维链、test-time compute 11:06 强化学习和思维链,都是在解决数据问题 11:34 强化学习可以补充专业数据,它更适合规则清晰、反馈清晰的领域 16:50 思维链(chain of thought)是在补充抽象层次较高的宏观数据 23:09 强化学习和思维链可以正交,比如可以通过强化学习也生成一系诶思维链分步骤数据 25:07 列出思维链:最初是人写,现在可能是用规则,更优雅是靠模型 29:19 test-time compute,这不是直接补充数据缺陷,而是原本做一次的推理(inference)变成做 N 次,就像人的“深思琢磨” 31:18 强化学习、思维链、放更多资源给推理,每一个单独看都不是石破天惊的 idea,但 OpenAI 做了很好的组合 34:36 “2022 年以来大模型领域最重要的一张图”,揭示 inference scaling law ·总算力需求会提升,短期有冗余,o1 不改变训基础模型公司减少的趋势 36:49 o1 新范式意味着需要更多 GPU 吗?对英伟达的影响? 38:51 猜想,预训练和强化学习的具体结合方式 40:56 算力需求也和参数规模相关,推理核心本身的参数可能不会特别大 43:32 从 API 收费看,目前 o1 推理成本可能是 4o 的几十倍 47:05 o1 最适合用在哪儿?Agent 可能能跑通了 48:45 程序员是最适合的 Agent 吗?辅助程序员在 o1 前就在发生 50:13 脑洞:o1 这类模型继续发展,能解决黎曼猜想吗? 54:28 目前 o1 很慢,但有优化空间,一个技术应用的规律是:效果在早期更重要,之后缩短计算时间、降低计算成本几乎是确定性的 58:15 为什么目前 API 调用对速率有限制,且不支持一些功能? 01:00:14 当前可做的推理优化:并行部分思维链计算,减少不必要的思维链过程 01:04:20 新变化也让一些工作可能没必要了,比如复杂的 prompt 工程 01:06:06 o1 对中国的影响:总体不改变训基础模型的公司变少的趋势 01:10:48 去年至今,GPU 算力价格已在下降,训练需求减少,推理需求增长暂时不会弥补,短时间 GPU 有冗余 ·AI 应用开发需求未冷却,只是更分散、更小微、个人化 01:13:13 供给端有调整,但在技术应用端,“我没有感到变冷” 01:15:13 更多个人开发者和小微企业做探索,更多其他行业来尝试,因为不需要完整 AI 班子了 01:18:33 应用未冷却和 VC 市场觉得应用没爆发不矛盾,因为对 VC 还太小 01:19:52 硅基流动推出云服务后增长很快。“如果每天和开发者打交道,不会觉得行业停滞或在变冷” 01:20:31 一些增长快的产品例子,捏他 01:21:38 云服务带来便捷的例子:Koji 十分钟写完 emoji AI 翻译器 01:24:20 继续坚定出海,目前硅流海外客户更多 01:26:32 硅流平台被调用最多的开源模型:通义、DeepSeek、Llama 01:27:39 “需求在这边时,谁都来帮你的忙” 01:29:27 硅流平台上的客户,每天调用数亿到 10 亿 token 的是有的 01:30:22 叶军分享的钉钉 AI 付费的启发:用户现在为小功能付费,而不是复杂大应用 01:32:46 从苹果手机可能是入口,到“巨头递减” 01:38:02 我们看到大模型的“瓦特蒸汽机”了吗? 相关链接: 本期播客文字整理版 袁进辉上次做客晚点聊:《58:光年之外联创再出发,与袁进辉聊 AI Infra 到底做什么?》 硅基流动云平台 SiliconCloud https://siliconflow.cn/zh-cn/siliconcloud 《OpenAI 再次给大模型 “泡沫” 续命》(《晚点 LatePost》关于 OpenAI o1 的文章) “蹭下热度谈谈 OpenAI 的价值”(播客中提到的中科院张俊林微博) 登场人物: 袁进辉,硅基流动创始人。联系可加微信:SiliconFlow01 程曼祺,晚点科技报道负责人。即刻:程曼祺_火柴Q 贺乾明,晚点科技报道作者。即刻:我是 chiming 剪辑:甜食
经过去年的技术猛进,今年下半年,市场对 AI 的关注焦点逐渐变成大模型到底怎么落地,怎么创造价值? 在诸多大模型落地的潜在方向中,SaaS,即面向企业和专业工作者的软件服务被认为可能是最快、最确定的一个。 今天的嘉宾是有十年 AI SaaS 经验的科大讯飞副总裁王玮。她是语音技术研发出身,2015 年主导负责和开发了中国最早的 AI SaaS 产品“讯飞听见”,这是一款语音转写 SaaS。去年,讯飞又将旗下的讯飞听见、讯飞会议、讯飞同传、讯飞写作等办公产品整合为智能办公 SaaS 平台。 我们与王玮聊了过去一年大模型对讯飞的 SaaS 业务带来的冲击与机会,过去十年她做 AI SaaS 的经验和教训,以及更久之前,她作为语音技术研发人员的职业成长故事。 在讯飞成立的 1999 年,中国还没有成熟的风投、融资创业不是主流,这是一家第一天就要平衡赚钱生存与研发投入的公司。在现在的创新、创业环境下,这种平衡也是很多想做大模型的公司要面临的情形。讯飞听见的故事可能是一个参考。 时间线传送: ·大模型给 AI SaaS 带来的冲击与变化 02:34 去年讲技术节点,精确到几月几号;今年全行业重点变成讲落地 05:53 AIGC 的价值是把人从机械工作中解放出来 07:17 讯飞也在侧重消费者业务板块,但投放上不是烧钱拉新逻辑 13:21 一批新公司主打免费,讯飞为何继续收费? 14:28 语音转写的体验差异要看困难场景的表现:多语种混杂,多人对话 16:14 从方言保护到语音技术的演变:过去需要语言学家,现在是技术驱动,未来可能需要对语言重新深入了解 20:10 大模型本身不足以解决“鸡尾酒会场景”等语音难点,还要配合工程能力积累 20:57 讯飞也在探索端到端语音技术 ·讯飞做 AI SaaS 的十年经验:软件+硬件+服务一起做 24:18 2010 年,讯飞第一次尝试消费者业务,做语音输入法 26:23 讯飞听见的诞生:语音输入法使用短语音技术,想做投入更大的长语音,需要一边研发,一边赚钱 26:48 AI 会带来失业吗?速记行业的“反讯飞联盟”的消失 29:11 讯飞听见一开始就同时做 to B 和 to C 30:07 to B 要适配国产操作系统,且要自己设计硬件工作站,方便企业私有化部署 32:50 产品经验:软件+硬件+服务 34:08 做 SaaS 一直要面临的抉择:更通用 or 更垂直(定制)? 36:43 具体场景案例:讯飞怎么做深会展场景? 41:25 为什么做 SaaS 也应该做硬件? 43:57 离线版的升级需要派人去做本地服务,需要做好交付团队和生态 46:05 AI SaaS 要追求 3 个成功:产品成功、市场成功、财务成功 ·聊未来:出海与行业悬念 52:39 AI SaaS 出海数据法规最严的欧洲,合规经验 57:08 未来一年,AI SaaS 的行业悬念——会不会有新商业模式 本期人物: 王玮,科大讯飞副总裁、听见科技总经理 程曼祺,晚点科技报道负责人,即刻/小红书:曼祺_火柴Q 剪辑:甜食
与播客爱好者一起交流
播放列表还是空的
去找些喜欢的节目添加进来吧