「我真的就是 AI 鲁滨逊!」 今天的节目关于一场前不久刚发生的真实 AI 实验:由五源资本发起的 “72 小时 AI 生存挑战”。 几个月前,我得知五源在筹备这个挑战时,觉得新奇又奢侈。很多人的疑问是:有这个时间,为什么不多看点项目? 挑战发起人,五源资本合伙人孟醒说,五源是想跳出信息茧房,验证一个问题:背景各异的更广泛人群,到底能用 AI 做到什么?他们唯一没有考虑的,就是怎么筛项目。 “项目我们平常也在看,我们希望做一点大家不干的事。”孟醒说。 挑战有两个环节:一是生存——在没有智能手机、电脑也不具备浏览器等工具的情况下,靠大模型和 AI Coding 等 AI 工具,选手们能否取得食物等生存物资;二是创造——每组挑战者会设定一个AI目标任务,比如应用开发、内容创作,甚至尝试用AI赚钱。 最终有 7 人参加挑战,其中 2 位这次做客了《晚点聊》:他们是完全不会编程的青年导演 利建磊,和从文科生转码的 AI 产品开发者陈郅悦。 利建磊,在生存挑战中得到了灵感,创作了短片《7.41》。陈郅悦已用 AI Coding Agent 开发了数个产品,而且已有收入。这次挑战中,她做了一个让大模型给真人主播反馈的 AI 虚拟直播。让没粉丝的素人也可以在友好、安全的氛围里,以直播方式去倾诉。 这次挑战实际测量了 AI 在数字世界的环境阻力:“其实 Agent 作为一个人的替代,它在它的生存世界里面是没有尊严的。本质上就是 Agent 需要跪在验证码之前,然后来去假装他是个人。” 也再次展现了人的社会性——人还是那么需要人。7 位挑战选手想尽各种方法,在这 72 小时中彼此交流和帮助。 本期嘉宾: 孟醒,五源资本合伙人 @播客「技术不无聊」主播 利建磊,青年导演,72 小时 AI 生存挑战者 @三石先生(小红书) @三石先生「新片场」作品集 陈郅悦,AI 产品开发者,72 小时 AI 生存挑战者 @cece陈(即刻) @cece陈(游光版)(小红书) 时间线跳转: -一个实验 03:13 起点:跳出信息茧房,验证 25 年初的分歧:普通人真能用 AI 做出惊艳产品? 07:14 1999 年的互联网生存挑战给了形式启发;但这一次,不仅挑战生存 15:10 五源的准备,自己先实验是否真能“生存” 17:56 五源创始合伙人刘芹的反应?——唯一不考虑的一点是找项目 20:10 利导和郅悦,两位的参赛故事 24:22 郅悦的 AI 虚拟主播,想法在这次挑战成为现实 25:34 无任何编程基础的利导,挑战是为了“按下暂停键” -生存 34:12 第一口热食的滋味 41:04 饥饿状态,度日如年 43:22 300 多人报名,从十几岁到 60 多岁,他们眼中的 AI 46:37 不仅有人和 AI 的协作,更多是人和人的交流 50:30 回到最初的假设:普通人,真能 AI 做好东西? 51:42 现有 IT 环境下,AI Agent 是在戴着脚铐运行 56:56 对 Agent Infra 机会的一个小型试验 -创造 57:58 利建磊马航主题短片《7.41》,想验证导演是否能在 AI 时代成为超级个体 01:07:27 陈郅悦的转码经验:跟着视频一步步学没用,干中学 01:09:55 3 个月开发第一个 AI 产品,现在每月约 1000 欧元收入 01:16:32 72 小时里开发 AI 虚拟主播,挑战后也在继续完善产品,成本比想象中低很多 01:31:33 小而美能长期存在吗?AI 是否在改变组织形态。孟醒说:“两年前他更相信这件事” 01:36:39 下一个可能想验证的新问题?——世界模型,或 AI 领域的新东西,谁知道呢? 01:41:51 经过这 72 小时,没变的和改变的 相关链接: 五源「72 小时 AI 生存挑战」视频纪录 《72小时AI生存挑战,发生了什么?》(图文记录) 《暗涌》对这次活动的报道:《72小时全纪实:人类与AI的第一次亲密接触 封面:72 小时 AI 生存挑战过程 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「这对小学生太幼稚了,对“我”刚好好。」 你想要一个 AI 潮玩或宠物吗?它不仅可以用忽闪的大眼给你安慰,也可以在解锁“地球语后”陪你学化学公式。芙崽 Fuzozo,这个朱啸虎聊了 10 分钟就决定投资的 AI 潮玩,没有瞄准儿童市场,而是想打动成年女性。 本期《晚点聊》,我们邀请了 Fuzozo 的创造者,RoboPoet 珞博智能创始人孙兆治,来聊聊他经历的 AI 陪伴赛道。 孙兆治曾多年在欧洲设计汽车,2015年回国,先后加入小鹏、滴滴任设计负责人,21 年加入小鹏机器人公司鹏行智能。23 年底开始创业。 Fuzozo 于今年 618 期间首发。半月后,大促期间定价 399 元的芙崽 Fuzozo 在首发渠道京东,卖出超过 2000 件,进入潮流盲盒销售排行榜前10 ,它前面的产品全部来自泡泡玛特。 图注:芙崽 Fuzozo 有 5 只,分别具有金、木、水、火、土属性。 孙兆治相信,给人提供陪伴和情绪价值的 AI 硬件赛道,被大大低估。他也已经观察到一些更大的玩家在跃跃欲试。 “我们已经知道就是有些大厂也下厂开始做。比如说米哈游。”孙兆治说。 但这仍然是一个非共识。市场对 AI 陪伴硬件有很多疑问:比如产品容易被模仿?用户使用不持续?AI 含量小、技术占比低,没什么门槛等等。我们在本期中,与孙兆治一一讨论了这些问题。 本期嘉宾:孙兆治,Robopoet 珞博智能创始人 时间线跳转: -养成系 AI 潮玩,IP 要严格遵守世界观 03:20 Fuzozo 作为 AI 养成系潮玩的玩法:亲密值、“毛毛语”、“地球语”、“写日记” 07:58 吐槽答疑:2 年就得换硬件?不存在 10:47 记忆只能同种族迁移,IP 要严格遵守世界观,“生命”就会有限制 -“对小学生太幼稚,对我刚刚好” 12:37 一开始就想服务 Z 时代女性;桌面机器人是有趣的技术尝试,但用户不想要 15:48 24 年融不到钱,25 年和朱啸虎聊了 10 分钟,对方投资 18:56 具身的此刻:demo 简单,稳定落地难 20:39 陪伴硬件上,TTS 语音和大模型能力同类重要 22:10 参考养成游戏,3 要素:精力投入、情感羁绊、社交节点 27:01 做减法的过程:保留最低生命感 31:18 最激烈的争论:会说人话 or 不会?——为何最终选前者 34:47 世界观的形成:金木水火土,是中国的 MBTI 42:30 AI 还占多少比例?陪伴真的需要“智能”吗? 49:22 京东直营的采购量,就有可能让 Fuzozo 成为 AI 陪伴硬件 25 年销量第一 -米哈游、泡泡玛特、优必选,不同背景大公司都在试 52:27 游戏的、机器人的、潮玩的,都在做 54:51 不怕和大公司竞争,也只能面对竞争 01:00:46 行业下一个节点——端侧模型直接部署到陪伴硬件上 -从巴黎的 46 天年假到连轴转,回国一定是正确的选择 01:05:33 在法国做汽车设计→小鹏、滴滴→鹏行智能,从巴黎的 46 天年假到连轴转,但回国是对的选择 01:11:53 何小鹏的汽车设计审美?小鹏的设计早年为何不连贯? 01:21:22 上一次创业做智能猫砂盆的复盘 01:24:54 出来混,重要的是“出来” 01:26:27 产品设计出身,如何学习 AI 技术? 01:28:56 抚慰人的孤独,值得做深 相关链接: 晚点独家丨不投具身的朱啸虎,投了小鹏机器人前成员做的 AI 潮玩 晚点聊 120 期:科创板后再访Insta360刘靖康:这何尝不是一种极限运动! 晚点聊 118 期: 晚点聊 107 期:与Haivivi李勇聊月入千万的AI Jellycat:小众AI硬件×大众消费品的交叉口创业 封面:5 只芙崽 Fuzozo 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「一个会写诗来描述数据库内核规则的人。」 这一期,我和晚点创始人小晚一起与 PingCAP 的 CTO 黄东旭聊,聊黑镜,聊 AI,聊他个人生活方式的转变:这是一次编程、科幻、创业的通感碰撞。 从黑镜第 7 季的故事,到中国最早做开源的 PingCAP 公司和他们的数据库核心,都有一些共通的逻辑和内核: Q:你们创业第一天是不是就给公司定下几条原则? A:第一条原则就是几个创始人我们是要组成一个分布式系统。分布式系统里面有一个很很重要的原则叫做互为冗余 程序之美,曾给还是中学生的东旭带来极大震撼: 对我比较影响特别深的 John Carmack。读他的代码时,我第一次从一个软件里边有看到像看一个艺术品一样的感受。 虽然这仍是一期和 AI 相关的节目,但最后聊到生活,黄东旭的一个建议是,其实不一定要搞懂 AI: 你养了一盆花,做一道菜,然后去认真的了解你身边的人,这个事情其实作为人的一个可能是存在的。这个意义比起一些我要去高峰,非得要高峰transformer的这个原理,这个不是要更加具体。 这期的开场和结尾 BGM,与平日不同。因为我用了黄东旭今年的新专辑 《Whispers of the Silent Mountains》 里的一首歌 《drifting_dream》。对,他还是一个野生音乐家。 本期嘉宾:黄东旭 PingCAP CTO,开源老黑客、野生音乐家 时间线跳转: -美剧与创业 03:17 十年前,看《疑犯追踪》的创业启发:为未来 AI 做数据存储准备 07:52 卖掉房子,开始住房车,“没用的东西全都扔了” 12:45 PingCAP 的创业原则:几位创始人构成分布式系统,互为冗余 13:41 《黑镜》第7季第四集的启发——简单结构,产生复杂智能 22:34 元胞机/生命游戏、TiKV,都是简单结构产生复杂智能 34:06 软件系统构建的“剑宗”和“气宗” 37:10 对智能不同理解背后的哲学差异:规律真能被掌握吗? -黑客、开发者与程序之美 43:51 沃兹尼亚克的启发:有趣很重要 47:04 创造 Doom 的 John Carmack:极致受限环境,优雅编程 50:51 放弃传统调式的 John Cage:打破常规 52:15 PingCap 所有联创此前都没做过数据库,从头开始思考怎么做数据库 -云原生和出海 55:26 曾经低估云原生的发展速度 01:04:45 PingCAP 的实践与教训:全球化是更好的本地化 01:05:45 中国为何不能诞生 DataBricks? 01:06:44 想成为最受尊敬的基础软件公司 -养花、种树,也可以不用搞懂 Transformer 01:11:27 学编程——最重要的是,有目标,完成目标,动手做 01:15:07 不能一直 vibe coding 01:19:14 PingCAP 的新思考:AI 需要什么样的数据存储? 01:21:06 不想看 Saleforce,自己写了个 Agent 01:24:24 做 database不会失业,每个人都会有自己的 Personal Data 01:30:36 开源是竞争策略,也是本身想做的事 01:40:45《神的九十亿个名字》我们是不是在加速来到结尾? 01:44:43 离开计算机,我的意义是?——AI 无法替代你体验 01:49:26 欣赏非数字内容,人造的东西会很珍贵 01:51:20 如果只能往宇宙发送一曲摇滚遗产,我会选《月之暗面》 01:54:56 看到美团跟京东的商战,什么感觉?——“他们在商战吗?” 附录: 描述 TiKV 规则的诗——The Zen of TiKV Everything is KV pair Every KV pair belongs to a Region, but a Region contains multiple KV pairs Every Region belongs to a Host, but a Host contains multiple Regions Region comes from nothingness, only specifying the beginning and the end of a KV range Initial Region is (-∞, +∞) When Region is too big, it splits When Regions are too small, they merge Region can copy itself (to other hosts) Region can also destroy itself Regions live and prosper 元胞机 (Cellular Automaton):一种在网格上由简单规则驱动的离散计算模型,每个“元胞”根据其邻居状态演化。 沃兹尼亚克 (Stephen Gary Wozniak):美国电子工程师、程序员和发明家,苹果公司联合创始人之一。 约翰·卡马克(John Carmack):美国著名程序员、游戏开发者和技术企业家,id Software 联创,开创了《毁灭战士》(Doom)、《雷神之锤》等游戏及其3D引擎技术。 约翰·凯奇(John Cage):美国先锋派作曲家、音乐理论家、作家和艺术家,以实验性音乐(如作品《4分33秒》)和运用偶然性而闻名。 Doom (《毁灭战士》):由 id Software 开发、约翰·卡马克等人创作的第一人称射击游戏(FPS),极大推动了该游戏类型的发展和3D图形技术。 《神的九十亿个名字》 (The Nine Billion Names of God):阿瑟·克拉克创作的一部著名科幻短篇小说,讲述一个计算机项目旨在列出神的所有可能名字及其引发的宇宙性后果。 相关链接: 黄东旭的博客《东方美学与软件设计》 晚点聊108:与马毅聊智能史:DNA是最早的大模型,智能的本质是减熵 晚点聊116:当 AI 研究者写科幻,与 Meta 田渊栋聊他的智能想象:我们终会“所思即所得” 封面:黑镜第七季第四集 Plaything 的剧照 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「你只活一辈子,要活得不一样。」 今天的嘉宾是刚刚进入新阶段的影石 Insta360 创始人,刘靖康。 本周三,6 月 11 日,影石成功登陆 A 股科创板,开盘即大涨 285%,市值一度突破 700 亿元人民币。 影石现在把全景相机做到了世界第一,在运动相机的市场份额,也已接近目前排名第一的老牌玩家 GoPro,且有反超的趋势。 图注:搭载卫星倍长征二号火箭发射升空后,Insta360 ONE X 系列全景相机拍到的地球与银河的同框。 两年前的夏天,我们就访谈过刘靖康,文章在这里:《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?》 现在再与刘靖康聊,他对怎么做产品,怎么运营一个更复杂的组织,都有了更深的实践和思考。他更清晰地描述了自己的长期目标——一个是做世界级的产品,一个是做一个新形态的学习型商业组织。 他也分享了仍需修炼的能力,和仍然存在的困惑。 刘靖康说,他做很多事的动力之一是 YOLO,You only live once,你只活一次。那么,该怎么对待只有一次的人生?创业、做产品和做公司,都是他的答案之一。 本期嘉宾:刘靖康(JK),影石 Insta360 创始人 时间线跳转: -从“猎人策略”到“包围式差异化”进攻 01:32 这有点儿像,你 4 年前就领了证,今天才办婚礼 04:14 两年三变化 07:37 “猎人策略”进化,新的 3 种 level 13:00 AcePro 为何跳入与 DJI Action、GoPro 的更直接竞争? 18:57 包围式差异化式进攻 22:25 影像是「开放世界的市场」,就像游戏,产品之间难以等效替代 25:28 不要忽视任何环节做好带来的增益,和没做好带来的损失 -防比攻更难,但能力提升也更快 27:48 大疆也要发布全景相机了,如何应对? 31:06 Ace 系列有挫折,但此刻是好结果 34:00 两种产品思路:需求导向 vs 竞争导向的平衡 37:18 员工学滑雪、潜水,费用都报销,鼓励他们成为目标客户 41:29 全焦段、全场景,愿景是“帮助人们更好记录和分享生活”,而不只是运动 43:56 防比攻更难,但也更能带来能力提升 -开放世界竞争,有门槛、难有壁垒 49:00 大多数消费电子品类,有门槛、难有壁垒 54:18 无人机市场的门看似焊死了,其实也能推开 55:11如果我账上的钱只够活三个月,傻子才会跟他竞争 56:57 抓住大机会的公司都不是“白纸”,是机会到来时能力积累最 ready 的组织 59:16 试,这不是最经济的方式 01:03:03 say no 的方向:为何不做车载?电影机曾经的失利 01:09:24 何时谋定而后动,何时跳下水迭代 -控制住,别直接给答案 01:18:15 AcePro 2 街拍套装都要上市了,我才知道 01:22:00 提高决策能力的唯一方法是,决策、行动,然后获得反馈 01:27:03 最难的是,克制住直接给方案的冲动,这反人性 01:29:42 表扬要公开,批评要单独;给负反馈时,不要高高举起、轻轻放下 01:31:55 试图打造员工发展第一,客户第二,股东第三的组织 01:36:39 这家公司赚的是“开发新知识”的钱 01:40:35 面对员工吐槽:识别目标员工,解决共性问题 01:42:27 定期识别隐性职责和跨部门职责 01:50:00 矩阵式组织的关键是,上下左右对齐目标 01:54:49 组织上什么最难?激发人心 你的底层不是一场战争,是 YOLO 01:58:40 组织复杂性将持续,但会迭代优化 02:01:26 眼镜也许是大机会,但非 Insta360 的大机会 02:07:50 迄今为止,最勇敢的选择 02:12:07 害怕失去,所以 YOLO,所以勇敢 02:14:39 你的底层,不是一场战争 02:17:50 有了孩子后,发现家庭记录场景的更高上线 02:19:18 4 个太多 & 4 个不够 02:21:09 被采访是提炼想法、明文表达的时机 02:22:00 我们就是公司里的极限运动玩家,不求安逸,All in or nothing 相关链接: 《影石 Insta360 刘靖康:当机会稀缺,年轻的后来者如何做到第一?》 晚点聊 118:天生卷王郭人杰:从 97 年的扫地机总裁到创业做家庭通用机器人 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「两个没完整操盘过 to C 产品的创始人,怎么找到病毒传播的法门。」 本期《晚点聊》对话爱诗科技联合创始人谢旭璋,他是创投从业者出身,现在做出了 6000 万用户的 AI 视频产品。这次播客中,他讲述了从投资人转身为 AI 创业者的动因,为什么视频生成是他眼中的终局机会,如何把产品做成爆款,以及如何在“资源节俭”的模型战略里快速推进。 同时,作为一名似乎没有等来好的投资时代的 90 后创投从业者,他也跟我们分享了从投资转向创业的心路历程。 时间线跳转: -从光源资本到创业实验 01:10 自我介绍:从光源资本到 PixVerse 联合创始人 03:46 接触 AI 生图,被 Midjourney 震撼到沉迷 06:11 周末泡在杭州线下黑客松,与技术合伙人组队创业 08:11 23年春节后,与王长虎结识及互补团队结构 08:55 视频是视觉 AI 的终局场景?变化正在发生 -要做普通人的 AI 视频工具,而不是冲击奥斯卡 12:13 别人想冲奥斯卡,爱诗想服务好普通用户 15:04 视频表达门槛高,AI 能降低表达门槛;但视频又是现在最重要的传播媒介 16:15 怎么让普通人做出第一个视频?“毒液模板”爆红,用户破千万 17:39 模板两个优势:不需要写提示词,也能提高抽卡率 18:57 收入增速翻了十倍,月收入千万人民币,(海外)订阅是主要变现方式 20:57 移动端产品上线前几个月,用户即破千万 22:23 AI 应用产品化还处于非常早期阶段 22:58 社区、共创、模版生态的未来可能性 24:12 用户不是专业剪辑者,而是普通人,新创作者 25:23 多模态生成仍有问题,正在探索 -创业公司的生存策略 27:15 稳健策略训练模型:很多同行的十分之一、二十分之一 28:40 资源节俭哲学:以少胜多 29:12 中国三家公司和 Google 是第一梯队,与 Sora 属于不同路径 34:53 不担心和大公司的竞争,因为视频行业还在快速发展 36:36 用户自发传播,不依赖平台流量 37:45 很多普通人的第一个万赞、十万赞、百万赞的视频就是用 PixVerse 做的 AI 模板:先全球化,再进入中国市场 38:25 国内市场已经验证过了:有人在咸鱼上求代做视频 39:25 视频是通用媒介,模板快、准、美是核心能力 41:54 用户主导内容趋势:AI 辅助用户而非替代创作 42:35 圣诞节“耶稣温暖你”模板在欧洲爆红 43:58 海外与国内产品版本一致,局部调整 45:08 美国、巴西、俄罗斯、印尼等人口大国主要市场 46:48 “每天刷 TikTok 的人”是 PixVerse 的目标人群 最基础的是模型能力 48:46 视频生成模型仍然有很大进步空间 49:17 模型迭代和产品相辅相成,模型技术用在什么场景很关键 52:21 看到的新架构架构趋势:DIT + 自回归 53:01 生成速度变得更快是更有意义的 54:11 探索 to C 也探索 API 模型、产品、用户的取舍 55:48 模型和产品的资源分配如何平衡? 57:00 和大语言模型不同,视频生成模型是“摄像头”,不能单卖 58:15 APP 面向普通用户,网页端更偏专业创作者 01:05:25 视频生成是无人区,所以过往有没有经验意义不大 01:10:07 什么是规模化的产品:用户留存和自然传播才算 投资人的能力迁移 01:14:50 在北大光华的读书时光:去硅谷访学,被创业氛围冲击 01:18:01 在光源资本时,经历互联网整合期 01:22:14 看过足够多的公司:看准了就要赌,要赌就要 all in 01:23:35 相信两类 founder:即使冒险也是热爱;坚持探索技术 01:24:14 同时入行的投资人,都在做什么? 01:26:28 在光源看过各种项目,但几个月达到千万月活的凤毛麟角 01:27:38 面对噪音,要相信自己 相关链接: 爱诗王长虎、谢旭璋:“不会创业” 的创始人,怎么做出用户量第一的 AI 视频产品 对话 PixVerse 王长虎:AI 视频生成可能通向新平台,Sora 只领先几个月 剪辑制作:甜食、Nick 本期主播:即刻 @王与桐 小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「竞争起来,我才最开心。」 本期我们同时拍摄了播客视频,将稍晚在 bilibili B站发布。 今天的嘉宾,是一位去年底被一级市场争抢的明星创业者,乐享科技创始人郭人杰。他 15 岁进入西安交大少年班,专业是能源与动力工程,后在伦敦政经学院获得金融硕士学位。 图注:郭人杰和乐享的小型舵机机器人,这是乐享今年将上市的产品之一,目标场景是让极客们做开发。2025 年 1 月,乐享团队将十几台原型机背到美国,用于和美国具身智能公司 K-Scale 联合举办黑客松。 2021 年加入追觅后,郭人杰在不到 4 年的时间里,从营销负责人做到了追觅中国区执行总裁。 去年 11 月,郭人杰离职,到 12 月底,他就拿到了来自 IDG 、经纬、真格、Monolith 和绿洲等机构的天使轮投资。其实那时,他只是想好了一个大的创业方向:要做面向消费市场的智能机器人。 在没有产品和数据的极早期阶段,投资的逻辑是看人。郭人杰有非常强烈的个人特质。 * 他极致接受高频试错和快速迭代,不到 4 年里,他和团队把追觅自有品牌在中国市场的销售额从 1 亿人民币做到了 60 亿。 * 他像创业那样去上班,倾尽全力、能上能下,4 年里,他两次被降级,又重新得重用。 这期节目的前半部分,我们聊了郭人杰在宝洁和追觅的职业生涯——一个“卷王”,能在不到 6 年的职场经历中如何学得更多、成长更快。 后半段,我们聊了郭人杰这次创立乐享的思考,郭人杰的理念是“赚钱养梦想”,他并不会声称,自己要做最前沿的探索,而是希望找到出于 0-1 之间的 “0.5 的机会”,它既不是那种大公司会一齐涌入的强共识,也是一个长周期里都不会有商业结果的方向。 图注:乐享科技将推出的机器人之二,用于家庭场景的“瓦力”,计划今年秋天上市。 乐享即将上市的机器人产品也体现了这种思考:比如其中一款,是给家庭市场做的户外陪伴机器人,它还原了 瓦力 的形象,非常可爱,这期封面,就是这款机器人。郭人杰在描述需求时,主要讲了信息交互和陪伴,并没有提到让机器人干活,这确实是目前技术还很难达到的状态。 在攻克具身大脑和寻求底层系统的突破之外,乐享是另一种智能机器人的创业路径。 本期嘉宾: 郭人杰,乐享科技创始人 & CEO 时间线跳转: -去宝洁,为了了解实业 02:17 少年班经历→伦敦政经金融经济学→2021年加入追觅,参与自有品牌0-60亿增长→2023年11月离职创立乐享科技。 04:01 加入宝洁时,如何为创业做准备 10:05 宝洁为何长寿:SOP/数据库/组织架构)、"敢为天下后" -追觅 4 年:从营销负责人到中国区总裁 16:06 俞浩(追觅创始人)面试时讲:高频试错+快速迭代;敢用年轻人 21:06 破格用人,"高激励+高淘汰",让大专主播月入 5 万 23:21 2021 年首战 618 成功,押对了抖音电商红利 32:08 结果备货没跟上,第一次被降级 34:47 重被任用后:先做洗地机,再快速做扫地机,功能全包围+差异化(烘干)+便宜15%,以B站长内容引爆扫地机品类 37:16 开始全渠道布局:不依赖抖音单一红利,拓展天猫/京东/社区团购 41:39 2022 年中国区销售额达 30 亿,但亏损,再次降级 51:21 新“军令状”:3 个月扭亏,高价 & 高端化转型 -创立乐享科技 55:50 离开追觅:生病、管理千人团队超出能力边界、想要新挑战 01:10:58 乐享科技不追求技术颠覆,寻找"0到1之间的0.5机会" 01:18:08 选择创业方向的 3 个标准: 避开纯技术探索和红海市场; 全球市场可行性,海外营销+国内研发; 与AIGC结合,延长创新周期,避免功能被快速复制 01:24:00 早期探索:从“机器人玩具”切入 → 发现“可定义动作”是核心价值 01:42:01 首款产品定位调整,与 K-Scale 合作开发平台机器人(售价$1000):满足学生/极客的 Sim2Real 需求 痛点:高校买不起更贵的机器人,不敢做高风险实验,年轻极客更买不起 产品逻辑:舵机方案实现基础运动(行走/跌倒爬起),开放硬件+软件平台供二次开发。 02:16:01 未来核心愿景“家庭移动终端”:解决拟人化交互(情感连接)+ 全场景移动(室内外地形适应) 拟人化:替代冰冷硬件(如用“哪吒声音讲古诗”比平板更有温度); 移动性:突破扫地机地形限制(如履带结构适应台阶/户外)。 02:18:43 第二款产品:履带式瓦力机器人(预计 2025 年 9-10 月上市):迪士尼IP授权,一比一电影还原设计 创业策略与行业竞争 01:53:57 “赚钱养梦想”:短期,教具产品保现金流,长期,家庭终端产品探索。 02:00:00 拉来科沃斯前 CTO,招募 AI 背景年轻人:创新+经验组合 02:04:00 与 K-Scale 的分工:互补短板 → “他把我们硬件工程师的照片挂墙上致敬”。 02:13:40 完全没有竞品的赛道可能没活力:“我创业第一天就渴望竞争” 02:21:54 多产品并行逻辑:“发挥快速迭代基因,广泛洞察→收敛需求→快速验证”。 02:25:03 中国硬件公司三代演进:代工仿制→性价比出海→定义新品类和标准 02:28:43 拓竹启示:3D打印机从极客工具到家庭设备的跨越 ,“重新定义品类是硬件公司的最高追求”。 相关链接: 《晚点独家丨追觅前中国区执行总裁郭人杰创业做机器人,接近完成首轮融资,估值约 5 亿元》 晚点聊 112:与千寻科技高阳聊具身:一个像机器人的人,怎么做像人的机器人 晚点聊 86:We,Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65:信仰充值的威力,与逐际谌华聊 GTC 和人形机器人新进展 晚点聊 40:与梅卡邵天兰聊通用机器人,AI 的下一个浪潮? 《梅卡曼德邵天兰:“通用机器人” 的吹牛竞赛与现实路径丨具身智能对话#9》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「Business model is the best model.」 本期的嘉宾是 A 股上市公司,千里科技的董事长印奇。他今年 37 岁,已 AI 创业 14 年。在 2011 年,印奇和同为清华姚班的同学,杨沐、唐文斌一起创立旷视科技时,3 人都在 22 岁上下。 图注:旷视的三位创始人(从左至右):杨沐、印奇、唐文斌 上一轮 AI 热潮中,这群年轻人打造的旷视,后来和商汤、云从、依图并称为 AI 四小龙。四家公司曾累计融资 80 亿美元,不过至今无一家规模盈利。从 2020 年到 2024 年,旷视一度在科创板上市流程里等待了 3 年多。 去年年中,印奇得到一个新机会,入股力帆科技,担任董事长,继续做与硬件终端结合的 AI,第一阶段是做 AI+车,即智驾和智舱的完整方案。力帆科技在今年初改名千里科技,千里股东之一的吉利会成为其重要的合作伙伴。 从年少成名、高歌猛进,到被资本追捧,再到公司被美国制裁、两次上市遇阻、苦寻商业闭环未果——印奇完整经历了上一轮 AI 热潮的起落。 本期包含了今年 3 月中旬和 5 月初,我们与印奇的两次访谈: * 其中 3 月这次访谈,我们集中聊了从旷视到千里的转变,印奇对过去 AI 创业的总结,和千里的新进展; * 最后一部分则是 5 月的访谈,我们更多聊了 AI 大模型的创业机会,和正在快速涌现的 Agent 应用市场。 印奇仍在追求 AGI,但不再是以 22 岁时那种一往无前的方式。这是一个有关 AI 创业的非爽文故事。 本期嘉宾: 印奇,千里科技董事长 时间线跳转: 3月中旬的访谈 - 从旷视到千里 03:17 AI 是 lifelong 的方向,一直想走软硬结合的 AI 05:55 继续推动旷视上市、大模型创业、AI+车(千里),三个选项里为何最终选了千里? 08:34 更倾向 AI in physical,AGI 必须有物理支撑 13:16 智能机器人未到爆发时机 - 只有技术信仰是不够的 17:43 DeepSeek 破圈,不代表能形成商业闭环 18:41 搜狗、旷视、DeepSeek,前沿科技创新的“天才少年”组织模式 20:47 技术信仰 vs. 价值务实:所有不能闭环的辉煌都是暂时的 25:24 一代版本一代神,组织能否迭代决定未来 - 千里新战略 26:10 千里战略关键词:AI 加车,差异化,聚焦智驾 28:43 开放 + 国际化,与吉利的合作不是绑定,而是起点 30:25 供应链开放:寻找各环节最优产品,组成完整方案 35:21 深度绑定车企才能形成数据闭环和技术支点 40:40 对 VLA 的判断:具身更需要 VLA,车的动作(action)很有限 44:41 中国智驾要回归基本功,提升模型化比例 49:39 技术品味来自背景积累,但也不用神话技术背景 52:17 智驾合适的商业模式是 2B2C,消费者要为软件付费,软件才能持续迭代 - 卡在上市流程的 5 年 54:46 低谷的 5 年反而是成长最快的 5 年 58:29 价值务实 + 精细经营 + 战斗型组织 01:06:01 调整研发与销售投入比例的过程——客户导向不是说出来的,而是价值链压出的 01:08:16 管理没那么多新概念,因为人没变;世界是连续的,不存在真正的突变式创新 01:11:13 好的科研关键是定义好问题,创业也一样 01:14:15 在互联网领域,what 很重要;但在大部分其它行业,how(执行力)比 what(认知) 重要。 - 节奏比方向更重要,智驾已进入冲刺期 01:17:54 节奏比方向更重要,要判断冲刺时机 01:20:04 智驾冲刺信号已出现,赢下冲刺所需的 3 个体系 - 见世界、见众生,然后见自己 01:26:50 比以前更狠了?——更追求结果了 01:30:51 聪明人用笨办法,不奢求用小的力获得大成功 01:33:50 为何在少年时就找到 lifelong 的方向? 01:35:30 姚班的科研价值观 01:41:38 人类会选择虚拟世界吗? 01:45:34 艺术家徐冰,科技边界扩大,艺术边界缩小 01:47:57 当你对这个世界有认知,跟一群人做成了很多事,最后可能才能真正知道内心支点,见自己是最后的。 5月的访谈 01:48:31 AI 现在是一个大周期的决赛环节,各公司的积累 01:52:05 Super App,短期有爆发势能,长期上限高 01:54:42 第二阶段的 Super App 方向:Agent——四种分类(办公、内容创作、生活、情感陪伴)& 机会比较 相关链接: 《晚点对话印奇:AI 1.0 的教训是,所有不能闭环的辉煌都是暂时的》 《旷视印奇入主力帆始末:放下上市执念,赌汽车智能化》 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「到那时,高级文明最想要的宇宙资源会是:good idea.」 这是「I,AI」的第二期,这个系列中,我们会讨论 AI 和我们日常工作与生活的关系。 这一期的嘉宾是 Meta GenAI 研究总监,田渊栋。他是 AI 研究者,先后于上海交大、卡耐基梅隆大学机器人研究所获学士、硕士和博士学位。田渊栋自 2005 年开始探索智能和人工智能,最近 10 年,他一直在 Meta 从事 AI 研发。 他还有另一重职业身份——小说家。博士生期间,田渊栋就开始写小说。他在 2021 年连载完了第一部长篇科幻小说《破晓之钟》,这本书在 2024 年正式出版。 《破晓之钟》写作于 ChatGPT 热潮之前,全部内容都是田渊栋自己写的,没有借助 AI。而书里的核心科幻概念和科幻点子,则体现了一个 AI 科学家的技术思维。田渊栋认为,每个技术时代——蒸汽时代、电气时代、信息时代、智能时代——都对应的不同科幻命题和故事。他想写出有 AI 内核的科幻。 几年后再看,书里的一些设计,“预言”了后来围绕算力与智能的攻防战,本书也讨论了当人类不再需要工作时,可能带来什么危机。 这一期,我们会从《破晓之钟》这本科幻长篇开始聊,延展到田渊栋对未来 AI 技术、社会与人类命运的想象。 图注:《破晓之钟》2024 年出版版。 因为本书的主角和英雄们是一群研究者,我们也由此聊了 AI 研究人员的生活与选择。田渊栋也分享了 2023 年之后,他如何尝试在写作工作流里引入更多 AI,AI 现在能帮他做什么,还不能做什么。 由于本期节目是远程录制,音质有一些瑕疵,请听友见谅。 本期嘉宾:田渊栋,Meta GenAI 研究总监,他的个人网站 时间线跳转: -《破晓之钟》写作意图 & 故事设定 05:03 《破晓之钟》想写AI时代的科幻,融合少年热血与中年反思 07:35 主要情节:外星人非暴力入侵,以“完美虚拟生活”诱惑人类;一群研究者如何寻找出路 *-书中的 AI 思维和未来文明想象 * 12:34 灵界立方灵感来自英伟达 GPU 互联,20 年的科幻点子现在照进现实 16:44 人们的两种选择:进入虚拟世界 or 拥抱未知星海 19:38 “虚拟永生”带来的不可忍受之轻和平庸 23:24 结尾悬念:人类真的逃离灵界虚拟世界了吗? 26:03 高级文明银河联盟的动机:寻找独特的智慧和宇宙角落里的其它更优解 29:44 技术终会发展到“所思即所得”,好的发展思路被渴求 35:11 人类进入虚拟世界已成趋势,服务器更适宜星际旅行 39:53 虚拟世界带来短期冲击、中期内卷、长期机会——当我们从常规工作中被解放,创造力可能爆发 -研究者的处境与生活 45:34 AI 未来能否做科研?现阶段仍不具深层推理能力 48:50 田渊栋早年在深度学习相对冷门阶段的研究经历 55:10 小改进 vs 大革新,两类科研者的贡献与角色都很重要 01:00:04 技术 leader 的任务:掌握方向,识人用人,制定策略 01:03:02 从埋头苦干到战略设定,再回归 hands-on 的转变 01:06:08 借助 AI,现在的研发团队可以更小、更精悍 -AI 研究者 & 小说创作者的双重生活 01:12:27 AI 生成的内容,仍缺乏对人物关系的理解和长线逻辑 01:14:40 不同 AI 模型的使用体验:Claude 相对擅长人物关系;给定大纲后,Gemini 可以完成具体情节;DeepSeek 适合“脑洞”,用来写小说“很麻烦” 01:17:28 自制写作工具:人机协作,用 AI 补空、润色,保持人类创意主导 01:25:19 人类独一无二的经验,短时间内无法被 AI 替代 01:26:32 就像银河联盟想要全宇宙的好想法,大模型现在也最需要人的智慧(数据) 相关链接: 《幽夜星火》连载页面 晚点聊 115:华为发布超节点,如何搅动AI算力市场?与魔形智能徐凌杰聊芯片层新变化 晚点聊 109:数字生命卡兹克如何用 AI:把任何要重复 3 遍的事 AI 化 晚点聊106:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q 题图:ChatGPT 生成,prompt 是《破晓之钟》里的一段描述: “人类遗产信息已编辑完成,若计划失败则发送:“我们是人类,曾于银河系悬臂太阳系第三行星居住,被银河联盟毁灭。我们知道四种基本力及一百一十八种由不同原子核构成的元素,目前模式识别方式为多层非线性神经网络……我们存在过、进步过、抗争过!感谢您的收听。” (ChatGPT-4o 并未生成正确的元素周期表。) ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「从拼单颗芯片的性能,到优化多芯片互联的系统。」 AI 算力,现在是中美都最关注的 AI 底层竞争力。约 1 个月前,华为推出由 384 块昇腾 910 互联而成的/超节点 AI 集群,CloudMatrix 384。 图注:这是超节点发布会上展示的 CloudMatrix 服务器机柜组,如播客中介绍的,一共是 12 台机柜(每台机柜里又有 4 个服务器),中间有光纤、交换机等部件连接。 华为超节点发布后不久,我邀请有 20 多年芯片从业经验的徐凌杰来一起聊一聊这项算力底层的新变化。 自 2000 年代中期,徐凌杰先后在英伟达、AMD 和三星,参与设计 GPU 架构。后来加入阿里云,领导GPU 云计算基础设施的搭建;2019 年与张文等人联合创立国产 GPU 公司壁仞科技;2024 年开始新创业,成立魔形智能,专注 AI 算力集群产品设计和优化。 超节点本身就是一种从拼单芯片性能,到优化整个节点和机架的算力思路变化,徐凌杰的从业经验正好匹配了这一趋势。 本期节目的第一部分,我们聊了华为 CloudMatrix 384 是什么,它和英伟达 2024 年开始重磅推出的集群方案 NVL72 的异同。不止英伟达、华为,把节点做得越来越大,从集群芯片数量要性能,以网络能力弥补计算和存储的瓶颈,已成为算力市场的共识性趋势。 在第二部分,我们则主要讨论了超节点趋势,对英伟达、对其它国产芯片,对整个 AI 算力市场的可能影响,和一个“经典问题”:下一个改变算力格局的变量可能是什么? 节目录制后不久,华为超节点开始出货。据《金融时报》报道,一套完整的 CloudMatrix 384 售价约 800 万美元,是售价约 300 万美元的 NVL72 的 2 倍多。但要注意,这并不是华为的官方价格信息。 5 月 7 日,华为盘古大模型团队又在预印本平台 Arxiv 发表了一篇论文,称在 6000 多块昇腾芯片组成的超大集群上,实现了 7180 亿(718B)参数 MoE 模型的长期稳定训练。 本期嘉宾: 徐凌杰,魔形智能CEO,邮箱:[email protected] 时间线跳转: - 华为 Cloud 384 集群 & 把节点做大的趋势 03:15 CloudMatrix 384 是什么?Scale up vs Scale out 08:33 算力底层构成,不止 GPU,还有互联、网络、冷却等综合系统 11:09 NVLink、NVSwitch 是英伟达的另一重壁垒,69 亿美元收购 Mellanox 前后开始布局 18:22 广义与狭义的 AI Infra 20:38 第三方系统优化公司的机会?——同时掌握计算、网络能力的芯片原厂是少数 22:51 “超节点”好坏,看什么指标? 29:08 黄仁勋想推“训推一体”,实际上业界在怎么用 GPU? 33:17 模型越大,显存压力越大——显存正成为芯片主要成本 36:02 华为超节点功耗高,但中国电费成本相对小,以总量换性能 38:11 华为的多卡互联来自什么积累 ——华为在成为 Nvidia 之前已是一个 Mellanox 42:57 NV Switch 为何难?去年 AMD 49 亿美元收购 ZT 补能力 - 超节点趋势,对英伟达和 AI 算力市场的影响 45:43 华为超节点,短期不冲击英伟达,压力给到其它 AI 国产芯片商 47:51 英伟达 H20 已计提 55 亿美元损失,但可能通过技术手段提升部分性能 51:19 华为在阿里 Qwen3 发布当天宣布支持 55:12 英伟达上游有全球供应链支持,下游有客户生态,危险之一是客户集中 01:00:44 为什么 Google TPU 没有动摇英伟达的地位? 01:04:23 可能是 Nvidia 的“防守措施”:已成立“半定制”部门 01:06:17 为什么离开英伟达,十年前的老黄是什么样? 01:12:01 2024 年选择创业:看到芯片周边集群优化能做出差异化,也是长坡厚雪 01:18:44 新硬件架构的苗头?——存算一体、类脑计算(脉冲神经网络) 相关链接 一文洞悉超节点:解密AI时代的算力基 Pangu Ultra MoE: How to Train Your Big MoE on Ascend NPUs(盘古超级混合专家模型:如何在昇腾 NPU 上训练超大规模混合模型 晚点聊 103:用 Attention 串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 晚点聊 49:3nm 是谎言?光刻工厂真能造芯片?与汪波聊芯片行业那些流传的误解 晚点聊 32:最怕客户来参观的行业:和谈三圈仔细谈谈芯片 附录: GPU、GPGPU、ASIC、NPU:都是可以做 AI 模型训练和推理的 AI 芯片。GPU 是图形处理器,GPGPU 是针对通用计算(而非图形任务)优化的 GPU,AISC 是专用集成电路,它的性价比理论上比GPU 更好,但不如 GPU 通用;NPU(Neural Processing Unit)也是一种 ASIC。 DPU(Data Processing Unit)::数据处理单元,用于优化网络通信、安全和存储操作,减轻 CPU和 GPU 的负担,提升AI 算力中心整体性能。 GPU 的精度:如节目中提到的 FP8((8位浮点数)、INT8((8位浮点数) 都是 GPU 精度的一种,是不同的数据格式标准。DeepSeek-V3 和 R1 就是在预训练阶段使用了以 FP8 为主的混合低精度训练方法。 总线(Bus):计算机内部用于传输数据、地址和控制信号的通信系统,连接 CPU、内存和外设等组件,确保信息在各部分之间高效传递。 高速互联协议:用于在计算系统内部或系统之间实现高速、低延迟的数据通信的协议,如英伟达的NVLink、InfiniBand(由 IBTA 协会开发)和 PCIe (由 Intel、Dell、HP、IBM 等公司成立的联盟 PCI-SIG 开发),支持大规模并行计算和数据中心的高效运行。 Mellanox:一家提供高性能互联解决方案的以色列公司,英伟达在 2019 年以 69 亿美元收购了 Mellanox。 ZT Systems:2024 年,AMD 则以 49 亿美元收购了 ZT Systems,为云计算厂商设计、制造和部署复杂的计算、存储和加速器解决方案。 NVSwitch:英伟达推出的高带宽交换芯片,支持多 GPU 间的全互联通信,可提升系统整体性能和可扩展性。 NVLink:英伟达开发的高速互联技术,提供高带宽、低延迟的 GPU 与 GPU、GPU 与 CPU 之间的通信,支持大规模并行计算和深度学习任务。 Dynamo:英伟达推出的开源推理软件平台,支持多种 AI 框架和硬件架构。在谈到英伟达收购 Lepton.ai 的背景时提及。 英伟达的费米(Fermi)架构:英伟达 2010 前后开发、推出的 GPU 架构,开发过程很不顺利,经历两次流片失败。 神经脉冲(Neuromorphic Computing):模拟人脑神经网络结构和功能的计算方法,用脉冲神经网络处理信息,特点是高效能、低功耗。(人脑的功耗就比较低,只有 20 W 左右) 存算一体(Compute-in-Memory):将计算功能集成到存储器中的计算架构,减少数据在存储器和处理器之间的传输,提高计算效率和能效,适用于大规模数据处理和人工智能应用。 剪辑制作:甜食、Nick 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「你得相信,最坏的事情会发生。」 今天我们一次发了两期节目,嘉宾都是秘塔创始人,闵可锐。 113 期,是我和可锐在 2023 年年初的一次访谈,那次大模型热潮初期的漫谈中,有不少此后被印证的预言。本期,是 2025 年 4 月底,秘塔发布新产品“今天学点啥”之后,我和晚点科技组作者与桐,一起对闵可锐的访谈。 我们从“今天学点啥”这个新产品切入,聊了秘塔探索新产品的方法、思路和执行,以及闵可锐对 AI 应用发展的思考。 秘塔持续推出了一些有口碑和用户的 AI 产品,包括秘塔写作猫、秘塔搜索等。与之形成反差的是,在 2023 年的大模型热潮后,秘塔并没有加速扩张和融资,仅在 2024 年新融了 1 亿多人民币。整个公司的估值也是低得保守。 可锐是一个直言、坦诚,甚至有些“我行我素”的创始人。我问他为什么不融更多钱?他说,他当不了一个演员,他也不知道,为什么一些在他看起来拙劣的故事,不少投资人会 buy in,这超出了他的“能力范围”。 他说最初看到 DeepSeek 的人才组织方式,就觉得这样非常对。我问他为什么秘塔不是这么组织的,他说,因为“我们没钱”。 一方面,可锐的一些观点似乎有些悲观,他会说:“我们摸着石头过河,大厂摸着我们过河”;任何有潜力主要依靠大模型能力达到 1000 万 DAU 的软件应用,大模型厂商和大公司一定会自己做。另一方面,他依然在持续经营秘塔这家已经成立 7 年的小 AI 公司,拒绝了去年的一些收购机会。 这是一期小 AI 公司创始人的生存之道,也是一个“没有偶像包袱”的 AI 从业者的一手观察。 本期嘉宾: 闵可锐,秘塔科技创始人,@「AI秘塔」公众号 ID:METASOTA2018 时间线跳转: - 今天学点啥 03:05 今天学点啥:黑神话冯骥自来水,闵可锐自己打 70 分;马上会推出新优化 09:09 其实秘塔 80% 的产品决策是“我拍脑袋”的 11:18 to C、to B AI 产品秘塔都做过,不同的决策方式 18:14 “为什么没做 Agent 方向产品”——为什么做大家都在做的事? 20:32 Manus 的很多效果得益于 Claude;25 年的模型来做通用 Agent,成功率仍是问题 25:58 秘塔为何没沿着法律场景、做垂直 Agent? 27:56 收入是产品决策的重要指标;过去 7 年多少名噪一时的 AI 公司,要么死了,要么大幅收缩 29:45 我融不了很多钱;我讲真话大家也不信,也做不了演员 - 再聊两年前的「预言」 34:44 模型做不到全球 top 的 foundation model 创业公司挑战重重 36:14 做基础模型就应该是 DeepSeek 的人才组织方式 37:27 AI 战场都是聪明人,不要奢望兼顾 8 个产品、同时开几条模型线,还能在某个方向碾压别人 38:11 AI 一定要算 ROI 吗?AGI 也可以是消费 41:46 Llama4 再次证明,“一流资源、二流团队”打不过“二流资源、一流团队”;字节人才密度很高,关键是怎么发挥价值 42:55 梁文锋最懂什么? - 模型和应用的边界 44:56 to B、to C 应用,基础模型,我都可以做,不过没人相信 49:48 法律翻译、秘塔搜索,都不适合出海,但“今天学点啥”之后会出海 52:48 我们的对手会是 1 万亿的公司,你得相信,最坏的事情会发生 54:30 因为保守错失了哪些机会? 57:36 去年为什么拒绝被收购? 01:01:21 谨慎与抛弃沉末成本,闵可锐的双面性 01:03:28 Jasper 没死,但大家都要“踩一脚” 01:05:06 所有主要依靠大模型有潜力到 1000 万 DAU 的软件应用,大(模型)公司都会自己做 -模型技术讨论 01:10:19 大模型和小模型结合,只是个很简单描述;整体思路是:1.服务自己的用户 2.及时跟进下一代模型解锁的能力 01:16:46 o 和 R 真的在推理吗?智能的形式比本质更可验证 01:23:58 用强化学习做推理模型之后,很多人低估了好的预训练的重要性 01:25:42 Grok3 和 Llama4 是两件事,Grok3 成功证明了一个后出发的团队,能快速追赶一线能力 01:29:55 Scaling Laws 不是线性外推,很可能到了新卡点,又会有新突破 01:32:59 过去曾有哪些技术误判,导致错失机会? -过去两年,我各方面都更会了 01:37:26 我们摸着石头过河,大厂摸着我们过河,创业公司得更快找到下一个石头 01:38:43 一个足够灵敏的组织,理想 vs 现实 01:41:03 目前秘塔的团队分工、协作 01:45:52 为什么没找产品合伙人? 01:49:33 热潮前后,秘塔团队节奏的变化 01:55:25 23 年至今的变化:自己“更会了”,接下来希望能和整个组织一起成长 相关链接: 晚点聊108:与马毅聊智能史:DNA是最早的大模型,智能的本质是减熵 晚点聊110:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊107:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 剪辑制作:甜食 *本期主播: *小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q **即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「我现在有一个判断,很多人会认为是胡说八道:在这一轮大模型热潮里,中国投资人很可能会集体 miss。」 今天,《晚点聊》一次发了两期节目,嘉宾都是秘塔创始人,闵可锐。一次访谈发生在 2023 年年初,另一次是在最近。本期,是 2023 年 3 月中旬的那一次访谈。 那是中国大模型热潮的开端,王慧文刚自己投资 5000 万美元,成立光年之外,月之暗面还在组建,六小龙的名号还没有兴起,DeepSeek 还没有正式成立,字节等大公司也没有充分展现对 AI 的志在必得和激进投入。 秘塔当时已是一家成立近 5 年的公司,推出了法律翻译、秘塔写字猫等多款 AI 应用。现在更为人熟知的秘塔搜索则还没有上线。 回顾这次发生在热潮开端的讨论,恍若隔世,也有很多先见之明。那时可锐就有一些犀利的观察和观点,包括: * 中国 VC 可能会集体 miss 掉一位最有雄心的中国大模型创业者。 * 在大模型领域,传统的组织人才方式不work。 * 真正的天才想法很难被媒体和大众所认知。 * 预训练很重要,是范式转变,具体到Transformer架构,其实没那么重要。 * (2023 年上半年)未来半年各大厂商将密集发模型,但热潮不可持续,拿不到正反馈的团队将很快退场,速生速死。 * AI 产品领域的创业是战国时代,不论个人开发者和大厂之间,还是大厂和大厂之间,进入到一个所有人在PK所有人的状态。 * 研发投入 95% 是浪费,而且你不知道哪 95% 是浪费的。一流 researcher 能节约 80% 的成本,但大部分组织没能力知道谁是一流的 researcher。 在秘塔刚成立的 2018 年,闵可锐就写过一篇文章,叫《关于机器学习的前尘往事》(见 shownotes “相关链接”部分),这篇文章已经提到了当时 Anthropic 创始人,Dario 在百度工作期间,发现的 Scaling Laws 的雏形。这篇文章开头,是模仿《百年孤独》经典开篇的一个 AI 小故事。其中提到了 108 期节目中,马毅老师也聊到的 50 年代 AI 热潮中的“感知机”。 闵可锐是马老师在伊利诺伊大学任职时的博士研究生,后肄业创业。此前他获得了复旦计算机学士学位,和牛津大学数学硕士学位。 这期节目,我们完整聊了可锐的职业经历、秘塔创业故事、他在 2023 年年初对大模型格局的思考。而今天发的另一期节目,是最近秘塔发布新产品“今天学点啥”之后的访谈,我们从这个产品切入,聊了这两年的变化。 本期嘉宾: 闵可锐,秘塔科技创始人,@「AI秘塔」公众号 ID:METASOTA2018 时间线跳转: 00:05 开场介绍 -预训练的想法很重要,而非具体架构 02:20 秘塔的重心在应用;竞赛→复旦→牛津→伊利诺伊→第一次创业→猎豹→创立秘塔的简要回顾 05:48 2017 年前后的真正技术转折是:预训练想法的出现 12:36 2018 年,预训练到来后的创业选择:在特定领域做出价值→法律翻译 12:14 OpenAI 难以效法;ChatGPT 之前,行业没有技术秘密 14:41 GPT-3 刚出来时,参数规模大到短期内难以应用;没必要神话某一个架构 22:14 一些 idea 的引用次数很高,但不是真正天才的想法 25:25 Ilya 的成就:不是视觉背景的人做出了 NLP 突破,而是深度学习的不同领域在合流,AI 本身的泛化性在提升 - 创业两条路:大故事、很多钱 vs 服务好能服务的用户 27:17 Jasper 的贡献:找到一个机器贵、但人更贵的切入口 30:58 从法律翻译到秘塔写作猫,垂直领域到更泛 C 的转变如何发生 36:16 AI to C、to B,商业模式切身体验 40:42 “创业公司的差异化是什么?”——要“做着瞧” 45:56 AI 应用是战国时代,是所有人和所有人的 PK 47:43 AI Native 应用的突破很可能在交互上 52:16 秘塔也在自己训练模型,应用为重心的情况下,怎么做模型? 01:01:28 开源模型的影响 - “坦白来讲,大模型热潮也不是什么好事” 01:08:02 AI 热潮对秘塔发展节奏的影响 01:11:15 中国投资机构会集体 miss 模型层投资;开源是另一股力量 01:16:13 中国有雄心更大的人,但还没有进入人们的视野 01:19:14 这次热潮对比 2016 年 AlphaGo 之后的 AI 热,有何不同? 01:24:11 秘塔当时的新融资推进:战投比较积极,财投很谨慎 01:27:19 两种 AI 研究机构:手作坊 vs 工业化 01:33:24 95% 的研发投入是浪费的,而且不知道浪费在哪儿;OpenAI 的成功经验是找到会花钱的少数研究者,让他们花很多钱 01:37:14 短期 vs 长期,当前应用 vs 追求 AGI——“你以为的平衡,实际上是平衡不了” 01:44:13 AI 热潮给算力成本带来的变化 01:51:27 市场存在大的资源错配 相关链接: 关于机器学习的前尘往事(闵可锐) 晚点聊110:与明势夏令聊Agent竞争:通用入口之战就要来,创业要做垂、做专 晚点聊107:与真格戴雨森长聊 Agent:各行业都会遭遇“李世石时刻”,Attention is not all you need 附录 * BERT(Bidirectional Encoder Representations from Transformers):Google 于 2018 年提出的一种预训练语言模型,首次引入双向 Transformer 编码器来理解上下文,显著提升了多个自然语言处理(NLP)任务的表现。 * T5(Text-to-Text Transfer Transformer):Google Research 2019 年提出,它将所有 NLP 任务统一建模为文本到文本的转换问题。 * Vision Transformer (ViT):Google Research 2020 年提出,它是首个成功将纯Transformer 架构应用于图像分类任务的模型,将图像分割为小块并视为序列输入 Transformer。 剪辑制作:甜食 本期主播:小红书 @曼祺_火柴Q,即刻 @曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
「伯克利 BAIR 博士、清华叉院助理教授,跳进具身创业。」 高阳是清华大学交叉信息研究院的助理教授,同时也是具身智能公司千寻的联合创始人和首席科学家。 高阳在具身智能领域深耕多年,他是清华计算机系本科,UC Berkeley 博士,师从国际计算机视觉大师 Trevor Darrell。在 2016 年时,他就和许华哲一起做了端到端自动驾驶的课题,这在当时是个小众的方向,但如今已经成为自动驾驶行业的共识。 这几年在具身智能领域崭露头角的早期公司,多多少少有 UC Berkeley 学子的身影——刚才提到的许华哲是星海图的首席科学家,星动纪元的创始人陈建宇、最近刚刚加入估值最高的智元机器人的罗建兰,都曾在 UC Berkeley 深造过;创立边塞科技的吴翼也是毕业于 UC Berkeley。 在 2024 年,高阳与有产业经历的韩峰涛共同创立了千寻,千寻在非共识中找到的切入点是端到端+具身大脑+机器人本体+互联网视频预训练、模仿学习、强化学习。成立至今,千寻已经获得了四轮融资。最近他们也发布了VLA Spirit v1 的 demo,机器人可以叠衣服了。 这次我们不仅聊到了高阳的技术理解,也聊到了他的思维方式和过往经历。 创业者们都在尝试怎么把机器人做得更像人,而高阳像一个融入人类世界的机器人:他从不熬夜,早晨七点半“开机”,每天骑 31-33 分钟的共享单车前往工作地点,在每周固定时间健身;他相信 COT(Chain-of-Thought,思维链),认为所有事情都可以按照 COT 一步一步走向结果,不仅是生活,也包括学术研究和创业,甚至“一步一步,每一个链条都做好,自然会导向具身智能的 L2、L3 的实现”。 这位 91 年出生的具身研究者和创业者,不倾向输出斩钉截铁的结论,但他相信他推理出的一切,不管和别人的声音是否一致。 本期嘉宾: 高阳,千寻智能首席科学家,清华叉院助理教授,个人主页(内有邮箱联系方式) 时间线跳转: -“中国速度”在具身智能的体现:修机器 02:02 创业 moment:科学家能做的探索越来越少,这在大语言模型领域已经发生 04:09 团队搭建:产业老炮+年轻科学家 07:18 Figure 02 的 demo 很好,展示了快慢系统 09:38 中国相对美国优势在于修机器人快,不然修机器人的速度赶不上做实验的速度 12:12 具身智能的阶段划分 14:23 现在中国具身智能在从 L1 到 L2 的路上 -机器人必须得是“人”形吗? 14:41 机器人不一定是人形,但 L2 以后可能需要双臂+轮式底盘 15:31 没有操作、只有移动,不能解决主要矛盾 18:52 双足不难,没有本质的卡点 21:31 虽然操作重要,但一定得有上半身吗?其实是从成本角度考虑的,像“人”一定可行 23:53 人形机器人,到底是更精细分工,还是更泛化? -“端到端是走向具身智能的共识,分层只是短期工程选择” 27:00 端到端(VLA,Vision-Language-Action)是现在具身智能的共识吗? 28:53 训练过程:互联网视频预训练、模仿学习、强化学习 29:51 为什么叠衣服这样的操作会成为具身智能领域的“智商测试”? 34:14 快慢系统在叠衣服这件事里怎么配合的? 35:35 当前机器人的主要挑战是泛化性 -“人是分布式,机器人是中心式” 36:28 视频数据的可用量只有 1%,机器人学习怎么操作、预测轨迹 38:44 人类的肌肉记忆,机器人也有 43:33 跨任务泛化:强化学习成功率取决于基模的训练和 SFT(监督微调 Supervised Fine-Tun-ing) 45:00 具身智能也有 Scaling Laws 吗?做到 GPT3.5,可能需要 100 亿条有效数据、1 亿遥操数据、几千万强化学习数据 49:05 Scaling Laws 在仿真数据不成立 -“具身智能做到 GPT-4 那种程度还得5年” 50:32 为什么只做大脑不行?驯化新的躯体很难的 51:55 为什么只做本体不行?价值在大脑端,现在有了大脑能力才引起的风潮 53:06 机器人未来会像汽车产业链 55:10 关于朱啸虎说的没有商业化,高阳觉得现在最重要的还是把技术做好 56:41 行业何时收敛?当具身智能走向 L2 时 57:57 现在具身智能的瓶颈还是在 AI,要补齐才能成为“木盆” -个人成长:一位信奉 COT 的“小天才” 59:35 伯克利“归国几子”的介绍 01:01:27 同一个实验室的,还有许华哲、贾扬清等 01:03:22 2016 年博士最开始做自动驾驶,那时端到端自动驾驶还不被相信 01:06:41 学术不需要灵光乍现,个人的思考方式就是 COT 01:07:11 所以在明年 6 月具身智能会到 L2,再过一年半到两年 L3 01:07:34 读书时在 waymo 实习三个月:感觉脑子要坏掉了 01:10:15 读博想创业,但没好机会;毕业后回国做科研,伯克利“归国几子”兼职“HR” 01:12:43 跟许华哲最近讨论:看起来具身智能是个非共识行业,但这已经是坍缩、收敛后的结果 01:15:54 大学教授出来创业,会拍拍屁股走人吗? 01:17:37 一个崇尚规律的 ISTJ:不熬夜、骑共享单车上下班、规律健身 相关链接: 晚点聊 86:We,Robot-2,清华叉院/星海图许华哲看“Optimus”的门道 晚点聊 65:信仰充值的威力,与逐际谌华聊 GTC 和人形机器人新进展 晚点聊 40:与梅卡邵天兰聊通用机器人,AI 的下一个浪潮? 剪辑制作:甜食 本期主播:即刻 @王与桐 ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧