AI时代的聚光灯,不应只属于从零到一的创业者。 我们注意到一个有趣的现象:与热衷在全球舞台上表达观点的硅谷高管相比,中国的大厂高管们通常更倾向于低调行事。尽管如此,他们的平台掌握着丰富的资源、数据、人才和资本,他们的决策在切实地塑造着 AI 行业的未来发展。 「十字路口」希望做的,就是将这些身处一线的关键思考者,也带到你的面前。 上周,我们与阿里云副总裁旭卿的对话收到了不错反响;本周我们又迎来了另一位具有传奇色彩的重量级人物:蚂蚁集团副总裁、首席技术安全官,同时也是蚂蚁密算董事长的韦韬。 说韦韬是位“传奇极客”毫不为过。他是影响了一代留学生的精神家园——MITBBS(未名空间)的发起人之一;他也是一位坚定的开源信徒,自称“读着开源代码长大”,并始终致力于用自己的方式回馈社区。 这场对话源于「隐语」开源社区的三周年,韦韬和我们分享了很多日常可能不被大家关注、但非常关键的两个点: * 密态计算 (Cryptographic Computing): 一种能让数据“可用不可见”的技术,在保护隐私的前提下,让数据价值安全地流动起来,喂养出更强大的AI。 * 高阶程序(High-Order Program) : 一套全新的工程化思想,通过任务拆解和自动核验,构建可靠的保障框架,让它的每一次输出都变得可靠、可控。 「十字路口」讨论了大量模型、应用与infra,而本期内容我们之所以要把焦点放在这两个部分,是因为在 AI 的狂热之下,它们或许正是决定 AI 能否真正走向工业化、赢得长期信任的决胜点所在。 这也为今天的 AI 创业者和投资人指明了下一个可能的价值高地:当模型的“聪明”本身正变得越来越像普通商品,那么通过新技术、新办法去”构建信任、确保可靠“,或许才是建立真正商业壁垒和长期价值的关键。 👬🏻 图为录制现场 🟢 Part 1 韦韬的故事 0:55: 北大“宝藏男孩”,和一段被遗忘的互联网往事 03:21 最近喜欢的 AI 产品是什么? 10:00 什么?大模型的幻觉是“必要的”? 11:17 创立 MITBBS 的故事 —— “写站规比写情书还认真?” 15:53 黑灰产攻防的精彩往事 18:24 普通人保护隐私成本最低的一招(不是改密码) 🟢 Part 2 “看不见”的技术,如何改变世界? 24:24 密算是什么?跟普通人有什么关系? 28:47 不同技术路线之争 31:48 内部激辩:我们为什么要将核心技术「开源」? 33:13 密算如何帮农民解决贷款难题? 36:46 如何让新能源车保费降下来? 🟢 Part 3 用高阶程序驯服 AI 40:19 密态计算和大模型的关系是什么? 43:35 你用大模型的方式,还停留在“手工作坊”时代吗? 45:49 管控AI、让它不再“胡说八道”的三个“紧箍咒”是什么? 48:36 “高阶程序”和密算的关系是什么? 🟢 Part 4 挑战与未来 52:03 成为密算董事长后,面临哪些新挑战? 58:22 “吃螃蟹”的生意:如何让客户相信,螃蟹真的很好吃? 01:01:31 最初接触开源社区的经历?——“我们回应了期待,没有辜负善意” 01:06:53 发起「隐语」开源社区的目标? 01:09:13 隐语社区 3 年来最有成就感的事:非洲手机巨头的加入 01:21:40 有没有被 AI 带来的冲击影响? 01:23:54 高级程序员才能幸存?不,初级程序员迎来了最好的学习时代 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
在今年火热的 AI 硬件赛道里,AI 耳机几乎已经是一张“明牌”。它方便携带,能通过录下用户听到的声音作为 AI 的“耳朵”来补充物理世界的信息,弥补 AI 所需要的上下文。 那么,如何做一款 AI 耳机呢? 本周,我们邀请刚刚宣布获得来自蚂蚁、启明等投资机构亿元级规模融资的未来智能创始人兼 CEO 马啸,这已是他们今年的第三次融资。 未来智能推出的讯飞 AI 耳机在各大电商平台稳坐 AI 耳机销量榜首,创业到现在已经实现了持续盈利。 马啸分享了他做 AI 耳机的 15 年旅程,对 AI 硬件如何成为“入口”的理解,以及在硬件本身的“不可能三角”(即性能、续航与重量)中,如何做出艰难的取舍,并最终超越它。 除此之外,马啸也和我们分享了他在职场这些年的一些心路历程,当坚持把耳机做下去的决定不被理解,当所有人都告诉他此路不通,他如何顶着巨大的压力,在内心深处反复诘问自己:“万一是别人错了呢?” ——正是这份反思,让他学会在低谷中理解自己,并最终在“贵人”的点拨下,做出“follow my heart”的决定,开启了创业之路。希望这些分享能让大家有所收获。 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 02:21 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍产品、收入与利润、团队规模、创业前在做什么 🟢 04:54 穿越周期:AI 硬件的血泪与选择 * 我们给自己的定位:做全球最好的“AI 软硬件一体化”的办公助理公司。 * 穿越周期的感悟:亲身经历过上一代 AI 浪潮(第三波)“喧嚣过后又归于沉寂”的全过程。 * 所有的硬件都可以被 AI 再改造一轮,但你不能什么事儿都自己做,必须要有重点。 🟢 06:51 AI 入口不是“下一个手机” * 未来的 AI 入口可能不只是一个,不要总想着“用另一个硬件去打败手机”。 * 为什么是耳机?它是用自然语言跟 AI 交互的好方式,可以随时随地携带。 * 耳机的优势是随身,劣势是没屏幕、交互效率可能不高,但它是一个不可避免的交互途径。 🟢 10:09 AI 耳机的“5+X”能力与“不可能三角” * 创业初期的坑:AI 功能很强,但耳机本身很烂。一个好的 AI 硬件,首先要具备它原来该有的功能。 * 什么是“5”?耳机的五个基本盘:音质、外观、续航、降噪、佩戴舒适度。 * 什么是“X”?AI 耳机要超越传统耳机,它要能“陪用户一起听”,把外界的自然信息实时转换成数据流。 * 硬件的“不可能三角”:续航、重量(舒适度)和处理性能。必须取舍。 🟢 14:27 “性感”与“皮实”:AI 耳机的艰难取舍 * 牺牲一定的“性感”和“优美”,换取“商务化”和“皮实”。 * 商务用户一天可能有 6-8 小时的会议,需要 AI 录音全程在线,不能中途换耳朵充电。 * 把通话续航做到了 9-10 小时,市面通常是 5-6 小时。 * 最大的取舍之一:音质。好的喇叭是能耗大户,必须在续航和音质间找一个平衡点。 🟢 17:47 红海中的“非共识”:为什么平台巨头做不了未来智能在做的事情? * “AI 耳机”是共识,但“做什么样的 AI 耳机”这个问题下有大量非共识。 * 手机厂商(苹果、华为)必须做量大面广的耳机,在“5”个属性上卷到极致。 * “我们从第一天就很清楚:创业公司很难跟苹果竞争。”在垂直领域(会议办公)找突破。 * 服务几千万人的垂直办公助理,对平台(苹果)来说是“杀鸡用牛刀”,他们短期不会做。 🟢 23:03 未来智能的看家本领:在蓝牙窄带上传输音频流 * 行业难题:蓝牙通话会占满经典蓝牙带宽,无法再传数据。 * 未来智能的“黑科技”:改造 BLE GATT 协议(原用于传小指令),稳定传输语音流。 * 技术护城河只是短期优势。 * 真正的护城河是用户的心智和认可。 🟢 30:22 “用户一边骂一边用”:靠 80% 月活数据说服果链代工厂 * 2021 年(ChatGPT 前),“AI 耳机”概念不被接受。 * 打动苹果的耳机供应商 * 关键数据:讯飞上一款失败的产品(只卖 4 万台),App 月活竟高达 80%。 * “用户一边骂一边用”:骂耳机难看、音质烂,但就是离不开录音转文字功能。 * 创业的底气:只要把耳机本身做好,这个 AI 功能就能引爆。 🟢 41:14 务实的 8 小时:为什么不做 24 小时“Always-on” * 24 小时全天候录音?这个想法很激进,但现在一定是非主流。 * 人对隐私的关注非常高,技术、伦理、社会接受度都要跨越。 * 先把“工作 8 小时”里最有价值的点做好。 🟢 51:56 为什么不做《Her》?我踩过“万能助理”的坑 * 在讯飞做过中文第一个类 Siri 产品,但有两个瓶颈至今难解。 * 瓶颈一(已解决):AI 的理解能力。 * 瓶颈二(未解决):“服务贯通能力”。你想语音订机票?在线服务平台根本不愿开放他们的内部交易流程。 * “万能助理”最大的失败:告诉用户什么都能干,但每一样都干得非常平庸。 🟢 56:29 “硬件是短板原理,互联网是长板原理” “为什么很多互联网公司做硬件都不太成功?就是他用互联网思维做硬件。” * 互联网(长板):一个功能特别好就行,别的 bug 快速迭代。 * 硬件(短板):一旦发布,一个致命缺陷就能让公司完蛋。研发、开模、库存“像山一样压过来”。 * 硬件的渠道信心极其重要。 * 我为什么还选硬件?“硬件更像种地,春种秋收,能逐渐积累优势,让人感觉踏实。” 🟢 01:06:21 “万一是别人错了呢?” ——决定创业的 30 分钟电话 “我就怀疑自己,难道我想错了吗?... 万一是别人错了呢?” * 在讯飞后期的困境:公司高层已拍板砍掉耳机业务。 * 内心煎熬:抓着 80% 的月活数据,觉得“再做一代就能成”。 * 科大讯飞联合创始人胡郁对马啸说:一定要 Follow your heart,才能把自己的能量发挥出来。 * 以前听了这么多 follow your heart,但当自己真的在那个情境里了才真正明白这句话。 🟢 01:18:40 AI 人才的“巨大断层”:老专家可能不如新学生 * 做一家“本分”的公司,做“人机协同、解放人的能力”的 AI,而不是替代人的 AI。 * AI 人才出现了巨大的“撕裂和断层”。 * 上一代 AI,算法、产品、Coding 是分离的。 * 新一代 AI,他们天然就把场景、Coding 和算法融为一体。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
本周的十字路口,我们来聊聊 AI Infra,AI 的基础设施。 今年,OpenAI 这个基建狂魔疯狂刷屏,先是传闻中耗资千亿美元的星际之门(Stargate)超级计算机项目;最近又与 Oracle 签下价值高达 3000 亿美元的订单,要在全美建设 4.5 吉瓦的巨型数据中心。 这是什么概念?4.5 吉瓦,相当于近四个核电站的发电量;3000 亿美金,超过了许多国家的年度 GDP。 这些天价合同背后,传递出一个越来越清晰的信号——在 AI 的下半场,算法的创新固然重要,但算力好像正在成为终极的变量。 这场关于未来的军备竞赛,已经从代码和模型,延伸到了芯片、电力和数据中心这些更底层的物理世界。 正如 OpenAI 在去年底的一份报告标题:「Infrastructure is destiny」——AI Infra,就是命运。那么此时,中国的科技公司们在如何布局?在这场决定未来的竞赛中,我们又处于什么样的位置? 本周,我们请到的嘉宾是百度智能云 AI 计算首席科学家,王雁鹏。他的职业生涯完整经历了从大数据时代开始的中国互联网基础设施演进,他将“亲述”这段历程——从 CPU 时代的自研服务器,到 GPU 时代的大规模集群,再到今天,百度已建成国内首个全自研的三万卡集群。 此外,雁鹏还和我们聊了很多话题,比如: * 对硅谷 AI 巨头(OpenAI, Google, Meta)的看法 * 国产 AI 芯片破局的唯一路径是什么? * 作为架构师,如何不沦为“运维”,并找到自己的职业价值? 希望这期内容能对你有所启发。 🟢 02:41 快问快答 年龄、毕业院校、MBTI 和星座、一句话介绍百舸。 🟢 03:38 一部互联网基础设施演进史 从打车去机房搬服务器,到一键调度万卡集群,一个亲历者眼中的三大计算时代。 * 第一阶段:大数据时代。Google 用三篇论文定义了游戏规则,用廉价 PC 搭建高性能系统,让互联网大厂开始自建数据中心。 * 第二阶段:云计算时代。亚马逊以“弹性”为核心,通过虚拟化技术,让创业者告别了自己搬服务器的“史前时代”。 * 第三阶段:AI 时代。计算范式从 CPU 跃迁到 GPU,算力被堆到极致,但代价是必须“软硬一体”,软件不再能免费享受硬件红利。 * 为什么说大模型是真正的“工业革命”?它带来了 Scaling Law——一个可复制、可预测的“工业范式”,堆算力就能换智能。 * 当年的英特尔 vs 今天的英伟达:一个信奉“软硬解耦”,一个坚持“软硬一体”,为何后者成为了 AI 时代的唯一霸主? 🟢 25:06 OpenAI 千亿美金的投入是远见还是浪费? “如果 AI 投资白花几千亿是很不幸,但不投的风险更大。” * 算力、算法、数据,哪个更重要?——算力。互联网数据已基本耗尽,未来无论是合成数据还是强化学习,都需要算力“制造”新数据。 * DeepSeek 的“巧劲”能否对抗 OpenAI 的“大力”?两者不矛盾,算法效率仍需算力实践。 * 中美算力差距:3 万卡 vs 10 万卡,物理鸿沟将如何影响创新? * 万卡集群挑战:电力是巨大瓶颈,一个 3 万卡集群需园区级变电站。 * “现在建数据中心是浪费吗?”——不建才是问题。不建就是拒绝创新,现在的投入是“用钱缩短到达未来的时间”。 🟢 40:10 百度百舸:为何敢称“迄今最强”? * 百舸是什么?一个为 AI 打造的高效算力平台,核心理念是支持超大规模、异地异构异网使用,追求极致工程效能。 * “最强”的底气:源自百度十几年 AI 应用积累与芯片—平台—模型—应用的全栈一体化布局。 * 百舸的差异化:四层架构联合优化,实现内外打平、极致高效。 🟢 45:20 中国会诞生英伟达吗?AI Infra 还有创业机会吗? * AI Infra 创业的现实:有机会,但难诞生巨头。 * 中国版英伟达的唯一路径:它必须与“最先进的模型”深度绑定一起出现。 * 当国产芯片能支撑最领先模型时,它就成功了。 🟢 49:16 美国 AI 巨头们:各有路径 * Google 卷土重来:拥有最不缺的算力(TPU)与最深的技术栈。 * Meta 的天价挖人:资本逻辑合理(1 亿挖人 vs 1000 亿买卡),但组织上不健康。 * OpenAI:用未来愿景加杠杆,以高风险推动基建革命。 🟢 58:42 AI 时代,给新一代工程师的建议 “不懂算法的 Infra 不是好 Infra。” * 如何摆脱“救火队员”的宿命,做出能拿“100 万美金最高奖”的创新? * 为什么未来不懂 Infra 的算法工程师会被淘汰? * 顶尖 AI 人才的全栈能力:从应用到架构都要懂。 * 对新一代工程师的建议:这是个美妙的时代,打通技术栈,决定你能走多远。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我创办了十字路口,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间,在真格基金担任 Venture Partner(投资合伙人)。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我联合创办了十字路口,在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 的即刻 🎄 本播客由「新世相声音森林播客计划」支持。
AI Agent 爆发给上下游产业带来了哪些机会? 本期播客,我们邀请小宿科技联合创始人& CEO 杜知恒 William,和我们分享他们作为 Agent 背后的 AI Infra 公司,如何在 Agent 爆发之际抓住机会——专为 Agent 设计的小宿智能搜索和一站式模型聚合平台 SkyRouter.ai,推动公司整体 ARR 突破 2500 万美元的故事。 作为 Agent 领域里「卖铲子」的人,William 跟我们形容现在只是 Agent 元年第一天早上 6:05 分太阳刚出来的时候,还有很长的路要走和巨大的发展空间。除了 Agent,William 也在播客里分享了他的职业选择,从二级市场投资人到创业者的转变、学到的重要经验等等。希望对朋友们了解 Agent 以及背后的 AI Infra 领域有所帮助。 PS:小宿科技为「十字路口」的听众准备了一点福利,用这个链接 wj.qq.com 注册可以免费领取 2000 次智能搜索 API 调用或等值专业服务礼包。 🟢 第一部分:AI Agent 背后的基础设施服务商,如何做到 2500 万美元 ARR 02:02 十字路口 v.s. 小宿科技 William 快问快答 03:08 从航天科技专业,到金融行业,再到创业,每次选择都比较「跨界」 05:21 小宿科技具体是做什么的?AI 智能搜索+为 Agent 提供一站式大模型聚合平台 SkyRouter.ai 06:39 当越来越多的人通过 Agent 搜索,Agent 搜索行为变成机器对机器的搜索 08:48 服务 Agent 客户发现他们需要一站式基础设施服务 10:19 做智能搜索,经历了三个阶段:第一阶段,配合搜索 API 的全网全文读取 11:46 第二阶段,提前预判行业发展动态,自研自建微软必应搜索 API 的替代方案 13:20 第三阶段:Agent 爆发后,需要搜索能力,和多语言、定制化能力 15:57 通过自研+并购的方式抓时机,做搜索的人才有限 19:10 对 ToB 公司而言,早一点通过客户反馈提升改进也是竞争壁垒 20:25 提前做功课预判微软对必应搜索 API 的调整 24:42 过去的搜索竞争格局是全球每日搜索请求里 2%-3% 发生在 B 端,微软必应占主导 26:06 有 C 端搜索能力的大厂也会提供搜索 API 服务,但这对它们来说不是主营业务 29:52 根据 Agent 的需求优化产品和服务,Agent 有哪些大家想不到的搜索需求? 30:23 今天大多数 Agent 都是第一天做全球化,提供多语言和数据合规很重要 33:13 「今天是 Agent 元年第一天的早上 6:05」 34:20 很多 Agent 客户时间花在 Go To Market,把 Infra 外包给能提供一站式服务的供应商 37:13 做 AI Agent 有两个判断:第一,中国和美国的团队会成为 AI 行业里的主要从业者,中国出海创业者会有刚需 38:01 第二:从 2025 年开始,推理对算力的需求会显著超过训练对算力的需求,所以做 SkyRouter.ai 39:48 SkyRouter.ai 的三个竞争力:在全球有足够多的节点和分布式算力资源;平台稳定性;资源运营能力 41:18 迁移到 SkyRouter.ai 调用成本下降 10%-15%,这个钱是怎么省的? . 🟢 第二部分:AI Infra 行业分析 43:49 从 ChatGPT 爆发后 AI Infra 创业热,到 Agent 爆发后需要的 Infra 服务,这两年发生了什么变化?从抢卡到抢数据,从 IaaS 算力资源之争,到 Agent 厂商需要从 IaaS 到 PaaS 全服务 46:53 当下最大的挑战不是 Infra 能力不够,而是 Agent 行业还在找 PMF 47:39 谁找到了 PMF?Coding、办公软件,参考场景是 AI 辅助人类边搜索边完成工作 49:17 办公场景外,还有一些垂直场景:AI 做广告投放、AI 规划旅游路线、AI 信息获取等 50:27 短期 AI Infra 领域:最重要的还是 AI 原生应用能在用户规模和用户留存上实现质的飞跃 52:09 长期 AI Infra 领域:会延续之前的逻辑,算力会达到基准值,数据会变得更重要 54:01 「头部模型厂一定会自建搜索,但它不会自建全部的搜索」 55:06 「AI Agent 的繁荣程度会个性化和丰富化,头部模型厂不会占据 Agent 里很大的份额」 . 🟢 第三部分:个人职业选择和创业心得 56:08 从二级市场投资人到投身水深火热的创业:投资是分配资源,创业是制造新的生产力和新的资源 57:21 从大学四年级开始创业到在高瓴资本做投资 01:00:13 投资的决策大多数是短期的,创业的不确定是做事后能拿到什么结果 01:02:39 「创业之后,我觉得做投资时候的我很浅薄,现在对生意这个事充满敬畏」 01:04:44 做二级市场投资,做错承担的后果是止损;创业中战略决策错误,要承担大量的后果 01:06:42 「尽量要三思,多思考,先尝试,再 all in」 01:09:51 焦虑没有用,ToB 生意的好处是这次没有拿下的客户,回去改进得足够好,下次还有机会 01:12:16 希望一开始创业就知道的事:1)战略选择很重要;2)生意很难,包含很多因素;3)保持开放心态 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
“很正确,无比正确。” 当我们问起阿里巴巴 Qoder (Agentic Coding 产品)创始人叔同,关于他带领团队冲入全球 AI Coding 这片“红海” 60 天后的感受时,他给出了这样简单而坚定的回答。 他的底气,源自一份优秀的成绩单:上线 5 天用户迅速突破 10 万,仅 60 天斩获 50 万开发者用户。 AI Coding 可能是今年 AI 领域最热的话题。 Cursor 年营收达到 5 亿美元、估值飙升至 100 亿,成为硅谷最炙手可热的独角兽;Anthropic 也凭借其强大的 Claude Code,让收入增长曲线比 OpenAI 更陡峭。 在这片卷得炽热的战场,后来者阿里的机会在哪里? 本周,我们邀请到了曾多年担任阿里巴巴“双十一”技术负责人、最早在国内推进全行业云原生化的技术领头人,听他独家分享 Qoder 上线 60 天即取得“开门红”的背后,是怎样的产品思考、技术布局和组织能力在支撑。 🎉 本期节目特意选在 1024 上线,祝所有用代码改变世界的朋友们节日快乐,发量浓密,代码无 Bug! 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍产品、收入与利润、团队规模、Qoder 前的探索经历 🟢 03:27 AI Coding 全景图:从 0 到 1 vs 从 1 到 100 一个典型的用户路径:先用 AI 生成一个网站雏形,当它开始产生商业价值,再用更专业的工具去维护和迭代。这背后反映了什么? * AI 写码赛道的三种主流形态:服务于创作者的“想法落地”型工具、服务于专业开发者的“效率提升”型工具,以及直接替代人力的“数字员工”。 * 为什么说所有形态的 AI 写码工具,最终都不可避免地会走向“大一统”? * “没有自研模型的 AI Coding 工具,只是在帮模型厂商打工”,为什么说 Cursor 这样的公司最终一定会构建自己的模型能力? * 大厂做 AI Coding 产品有何天然优势?除了成本,更重要的是能和模型进行端到端的联动优化。 🟢 09:48 红海突围:Qoder 的战略选择 当所有人都去摘那些“低垂的果实”时,我们选择了直接进攻“价值高地”。 * 一个关键的战略选择:我们绕过从 0 到 1 生成新项目的“酷炫”场景,直接切入占开发者 95% 工作时间的“真实软件”研发领域。 * 为什么我们把 Qoder 定义为“智能体编程平台”?因为未来的开发协作模式,将从“人机协同”进化为“AI 自主编程”。 * “我不干,智能体干”,这是一种全新的开发范式。 * 另辟蹊径的原因:作为一个后来者,我们希望通过差异化定位,快速在红海中找到自己的生态位。 🟢 16:55 需求文档是最重要的! AI 不但擅长写代码,更擅长写需求文档。 * 从“提示词工程”到“上下文工程”,我们如何让 AI Agent 能够独立完成更大、更复杂的任务?答案是 Spec-Driven(需求文档驱动)。 * 一个典型的 Spec-Driven 工作流:用户提出一句话需求 -> “文档 Agent” 自动生成详细设计文档 -> 用户确认后驱动“代码 Agent”长时间执行。 * 这其实是对现实世界中“老板提需求 -> 产品经理写 PRD -> 工程师开发”这一流程的 AI 化映射。 🟢 21:44 产品哲学:从“不打断心流”到“给你掌控感” AI 时代,开发者被迫进行“结对编程”,过去那种完全不被打扰的“心流”已难以维持。 * AI 时代的新矛盾:既要提供趁手的工具,又不可避免地会打断用户的心流,如何平衡? * 我们的答案:与其徒劳地追求不被打断,不如给用户完全的“掌控感”,让他成为 AI Agent 的管理者。 * 一个反常识的产品设计:为什么 Qoder 至今不让用户选择模型? 因为“机选优于人选”,也避免了用户成为“模型测试员”而产生的决策疲劳。 * 我们如何平衡性能、效率、成本这个“不可能三角”?核心在“上下文工程”的精细化运营。 🟢 32:26 组织与方法:如何支撑一场闪电战? 为什么 Qoder 能够快速起步?因为我们不是从零开始,而是整合了阿里内部多个成熟团队的人才和技术积累。 * 从服务中国市场的“通义灵码”,到面向全球的“Qoder”,背后发生了怎样的组织和战略演进? * 一个关键决策:为了争取全球市场的时间窗口,我们先用全球最好的模型服务开发者,同时“以战养战”,为自研模型的发展赢得时间。 * “它就是独立经营的一块业务”,大厂内部创业如何通过组织设计,真正地“甩掉包袱”,实现创业公司级别的敏捷? 🟢 40:13 Repo Wiki:攻克“祖传代码”的秘密武器 我们学计算机第一课,老师就说要写好文档和注释,但几乎没有团队能真正做到。这是一个如此显性的需求,为什么之前没人做? * 开发 Repo Wiki 的第一性原理:“文档是会骗人的,但代码永远是最新的。” * 我们如何用 AI 解构“祖传代码”?通过分析代码的当前切片和所有历史提交记录,还原出整个系统的设计思想和业务逻辑。 * 如何保证这个文档不过时?随着代码库的变更,AI 会实时、增量地更新这份“活文档”。 * 为什么我们有信心构建壁垒?因为这不是一个原子能力,而是一整套深度定制的模型、Agent 和与 Git 结合的团队协作工作流。 🟢 01:03:19 | 1024 寄语:AI 时代,程序员如何进化? 程序员可能是最不惧怕学习的群体,这恰恰是我们在 AI 时代最大的优势。 * AI 会取代程序员吗?不会,同时“杰文斯悖论”告诉我们,当成本降低,需求会爆炸式增长,程序员的数量可能会变得更多。 * 未来工程师的核心竞争力是什么?从单一的编码能力,转变为“需求洞察、整体设计、结果验收”等复合能力。 * 给计算机大一新生的建议:拥抱 AI,但更要学好计算机体系结构,因为你得知道 AI 有没有在“忽悠”你。 🟢 01:09:48 | 双十一往事:一个顶级架构师的两次“高考” 老板给了一个疯狂的目标:双十一流量翻 50 倍,集团能不能不多花一分钱?我们最终做到了。 * “在双十一之前,先创造无数个双十一”,如何通过“全链路压测”这剂猛药,在真实流量下反复演练,驯服上千个系统? * 技术人如何永远“跟技术要红利”?从解决稳定性问题,到通过容器化、云原生技术极致地优化成本,这背后是一套完整的方法论。 * 顶级架构师的成长之路:从解决一个技术难题,到构建一套技术体系,再到将技术能力产品化、商业化,最终寻找更大的舞台。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
本周的十字路口,我们和庄明浩(「屠龙之术」主播)一起,复盘 2025 年的 AI 和科技行业的大事件,以及身处其中的我们的一些记忆与感受。 这一年,我们既是目击者,见证着技术的快速迭代、产品以前所未有的方式颠覆日常;同时,我们也被卷入了一场关于未来的集体狂想,在创新的巨浪和无尽的可能性面前,时而兴奋,时而迷茫。 我们从明浩提出的年度关键词“拐点”聊起,复盘了从年初的 DeepSeek R1 到最近的 Sora 2 的各种模型大战、Manus 引爆的“Agent 元年”;探讨了开源生态和人才流向;并最终将目光投向资本市场——当我们该如何理解这场关乎未来的集体狂想? 欢迎收听本期内容,和我们一起将在 2025 年亲历的观察与感受,沉淀为这段 AI 时代的共同记忆。 ———— 本期节目由鸿蒙特别呈现:「“码”上出发,洞见生态的力量」 —— 🎥 本期播客在 AI Hacker House 录制,视频播客将会发布于 Koji杨远骋 的小红书、B站、视频号、Youtube。 🟢 02:09 2025:向上还是向下的“拐点之年” “我们不知不觉地走到了很多事情的极限里面,技术也好,产品也好,钱也好。” * 尝试用一个词概括 2025,为什么说“拐点”一词最妙? * 向上的拐点:数据中心的建设狂潮预示着 2026 年的爆发。 * 向下的拐点:泡沫何时破裂?我们是否已在不知不觉中触碰到技术和增长的极限? 🟢 03:24 大模型战场:中美技术路线的分野与共识 * DeepSeek r1 如何用百万美金成本,撬动了百亿美金的基建叙事? * Sam Altman 重新定义“图灵时刻”:为什么 AGI 可能不会“翻天覆地”,而是“轻轻迈过”? * 头部模型厂商的生存法则:Anthropic 做深 B 端,xAI 走野路子,微软为何被迫自研模型? * 在纯 Chatbot 战场,战役已经打完了吗?ChatGPT 8 亿周活的背后,是护城河还是增长极限? * 中国厂商的共识与武器:为什么“开源”成了对抗美国 AI 趋势的唯一手段? * DeepSeek V3.2 的发布意味着什么?为什么我们今年可能等不到 V4 和 R2 了? 🟢 23:42 AGI 的另一条路:从 Sora 2 到世界模型 “如果视觉模型也是主桌,那它可能用另外一种方式会实现 AGI。” * 多模态战场为何比语言模型竞争更激烈?美图、营销视频 Agent... 场景和商业化路径无比清晰。 * OpenAl 的产品心法:为什么是 Sora 2 走入了千家万户,而不是技术同样领先的其他产品? * 这个世界真的不需要一个“AI 抖音”吗?或许 OpenAl 的目的根本不是做抖音。 * Google 回来了!世界模型 Genie 会是通向 AGI 的另一条路,甚至是“世界的子宫”吗? 🟢 39:04 Agent 元年,然后呢? * 为什么 Agent 将在 L3 阶段停留很久?因为它第一次将 AI 能力从“语言”延伸到了“行为”。 * Manus 的历史意义:它让用户第一次知道了 Agent 该长什么样,心智定义价值千金。 * Agent 创业公司如何活下去?当通用 Agent 成为巨头显学,垂直领域的法律、金融、营销反而异常繁荣 * 注意力经济的挤压效应:当主流赛道挤满人,为什么连“AI 动态漫”这种天花板有限的赛道都能拿到钱? 🟢 49:11 手机厂商的端侧 Agent * 为什么说真正的“手机助理”,Siri 做不到,但今天的端侧 Agent 可以? * 鸿蒙 HMAF 框架的启示:当 OS 不再自己做一切,而是将意图下发给 APP 的原生 Agent,会为开发者带来什么新机会? 🟢 53:00 开源、鸿蒙:中国特色的生态 * 从“头部模型一定是闭源”到“2026 年开源模型会登顶”,Sam Altman 的观点为何发生转变? * 开源如何商业化?DeepSeek 的 API 照样卖钱,且成本比 OpenAI 低几十倍。 * 开源如何成为一种“武器”?在争夺欧洲、东南亚、中东等中间地带时,开源天然地拥有信任优势。 * 本地部署的需求有多旺盛?一款内存和显存超大的笔记本电脑,因为适合本地部署大模型而被迅速抢购一空。 * 开发者有哪些新的“生态位”可以抢占?鸿蒙开发者凭借数款小应用月入 7 万。 🟢 01:08:36 二级市场狂热,一级市场呢? “当年大家认为 AI 是一个技术、一个产业,今天 AI 就是市场本身。” * Sam Altman 的“终局思维”:当一家公司试图将未来五年的增长预期全部打包,会发生什么? * 另一面,中国创投圈“我们太过熟悉的移动互联网增长叙事,在今天不能复制。” * 投资人如何寻找信心?当 AI 纯软件的故事讲不通时,大家开始集体投向大疆、石头、追觅背景的硬件创始人。 * 与互联网泡沫的终极拷问:光纤可以为未来铺路,但三年就会过时的显卡呢? * 有趣的信号:除了英伟达,今年标普 500 涨得最好的竟是希捷和西部数据这两家硬盘公司。 * 泡沫警报:当 AI 巨头开始依赖债务融资,令人想起“次贷危机”的幽灵是否正在靠近? 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
最近,美国多家 AI+医疗明星公司接连传来进展:OpenEvidence(医学知识搜索) 的 ARR 已突破 1000 万美元,每天有上万名医生付费使用;Abridge(临床文档转写) 完成 2.5 亿美元融资;Tempus AI(肿瘤学与精准医疗) 已在纳斯达克上市,市值一度超过 60 亿美元;Hippocratic AI(医疗专属大模型) 估值也已达数十亿美元。 这些公司共同展示出一个趋势:AI 正在全球范围内迅速重塑医疗行业。在国内,AI+医疗同样在如火如荼地发生。硅谷知名风险投资机构 a16z 预言:医疗保健将成为从 AI 中受益最多的行业。 因此本周,我们邀请到京东健康探索研究院首席科学家王国鑫 Nico,请他分享「京医千询2.0」大模型与「AI 医院」的研发与应用。他不仅谈到在企业战略层面,AI 产品如何通过京东健康的医检诊药生态,来满足用户健康需求,也解析了以 OpenEvidence 为代表的美国初创公司目前在 AI+医疗方向的主要探索与不同侧重。 医疗是监管最严、数据最敏感、决策最攸关生死的垂直领域。因此,Nico 今天分享的经验和方法——如何找到真实痛点、如何积累专业数据、如何在产品和战略层面争夺用户心智——**对所有垂直大模型行业都具有启发意义,**相信也能给正在思考 AI 落地的你带来一些参考与帮助。 最后,Nico 还带来了他作为科学家的个人健康管理小技巧,简单实用,谁都能用得上。 🟢 01:49 「十字路口的」的快问快答:年龄、在京东健康的年限、MBTI 与星座、一句话介绍产品“京医千询”、公司收入与利润,以及大模型业务的核心战略定位。 🟢 02:42 AI 的终极拷问:如何解决医疗行业最根本的痛点? “我相信每个人是都想活一辈子… AI 在这个里面扮演的最大的特点就是能不能提升供给水平。” * 京东健康每天有 49 万次医疗服务咨询,AI 最初的角色是保证业务“合规”与“降本”。 * 为什么大模型让所有人眼前一亮?因为它表现出高度的“类人水平”,开始让人思考创造“医生水平”的 AI 的可能性。 * AI 能否低成本扩大供给,让我们每个人都有一种均等的高水平服务?这是所有做医疗 AI 的人,最终极的价值创造。 * 大模型不仅能在身体健康上实现平权,也能在精神健康上实现“情绪平权”,接住每一个人的情绪。 🟢 07:57 医疗数据的「痛并快乐着」 医疗数据可能是数字化水平最高的行业之一,但为什么它仍然是垂直模型最难啃的骨头? * 医疗 AI 从业者的“幸运”:国内医院花了巨大的力气,跑过了信息化时代,数字化水平相对较高。 * 核心痛点:医生的思考和推理过程是缺失的,模型只能看到提炼后的结果,无法学习“如何思考”。 * 数据天然在物理上是分散的,确权也存在问题——数据到底属于医院、医生,还是患者? * 为什么以前跨医院检查不互认?即便同是 CT,也可能因为设备、技师的原因导致结果无法形成共识,这背后是专业壁垒。 🟢 12:10 一个内部申请预算的公式:什么样的行业值得做垂类大模型? * 判断是否需要垂类模型,可以从“数据是否低成本可获取”和“商业模式是否显而易见”两个维度来划分。 * 如果一个行业的知识门槛不高,经验能被新技术轻易替代(如语言教育),那么做垂类模型的机会就比较小。 * 为什么代码是垂类模型的“天选之子”?因为它的商业模式清晰到让所有通用模型公司都无法拒绝。 * 垂类模型机会的两大特征:数据拥有独占性和独特性;商业模式足够清晰且价值足够高。 🟢 25:29 京医千询 2.0:不止于文本,三大核心进化 * 进化 1:从真实数据到大量使用“合成数据”,并向行业开放了可模拟真实医患对话的 Agent。 * 进化 2:从单模态到多模态,一个模型内同时支持 CT、MRI、X 光等影像数据的理解。 * 进化 3:从简单推理到“循证推理”,模型做出的每个判断,都能追溯到具体的证据来源(如顶刊论文、国家指南)。 * 如何验证海量合成数据的准确性?通过“三层漏斗”:内部全职医生团队、合作医学院、百人外部专家质控委员会。 🟢 34:07 灵魂拷问:垂直模型在哪些具体问题上能秒杀 GPT? “医学最重要的是诊断准确和处置方案有效,专业压过服务体验。” * 专业模型的核心是“拟专家能力”:通过简短的核心问题快速做出判断,而不是像通用模型一样为了全面而问遍所有可能。 * 如果让通用大模型去看一张医疗影像,效率会大打折扣,而垂直模型专门为影像的专业词汇、脏器位置、微小病灶做了优化。 * 跑分和真实产品体验没有百分之百的关联,我们内部更相信专家的评估指标。 * 为用户建立专属的、可长期追踪的“家庭健康档案”,这是通用模型很难做到的产品差异化。 * 做心理医生的难度,远高于做内科医生。如何衡量和优化模型的“共情能力”是目前的技术难点。 🟢 55:17 AI 医院:一场争夺「未来健康第一入口」的阳谋 * 为什么要做“AI 医院”?当你有内科、药师、营养师等多个 Agent 后,需要一个统一的产品心智,去争夺用户的“健康第一入口”。 * 京东做医疗的底气是什么?我们是一家有实体医疗机构、有药品供应链、能实现 30 分钟送药上门的公司。 * 未来的竞争,将是 Chatbot 的能力,再叠加后端服务能力的通盘竞争。 * 对于通用大模型公司,我们更多地将其当做“合作伙伴”,而非“竞争对手”。 🟢 01:11:57 给普通人的建议:如何利用 AI 更好地生活? * 一个很反人性的洞察:健康的“需求”是无限的,但只有在“失去”健康时,这个需求才变得真实。 * 一个普通人能立刻执行的健康建议:每年强制拿出一笔钱投入到健康上,用经济手段“逼”自己调整认知,这在中期看是省钱的。 * 要相信一句话:很多疾病在早期发现,以今天的科技水平都是有解法的;一旦错过,就只剩下缓解的方法。 🟢 01:15:34 投资人视角:如何判断一个垂直大模型公司? * 这个行业的知识深度和数据壁垒真的存在吗?这是一个 0 和 1 的问题。 * 它的商业机会不能那么大,否则大公司一旦注意到,你就没戏了。 * 这家公司的商业落地预期是什么?是 API 付费、产品付费,还是销售驱动?创始团队的背景和能力是否匹配? 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
本周「十字路口」的嘉宾在职业生涯像是坐了一趟过山车——他就是前作业盒子创始人,现任 VisionFlow 创始人刘夜。 刘夜曾将作业盒子打造为覆盖上亿师生、服务十万所学校的教育独角兽,但双减突然发生,业务遭遇重创。而刘夜在经历了这场巨变后,决定在双减”废墟”上重新起航,开启新的 AI + 教育创业。 VisionFlow 获得约 1000 万美元的种子轮融资,出资方包括知名企业家李想、阿里巴巴合伙人曾鸣及语嫣等,是 AI 语言学习赛道种子轮融资最多的公司。 刘夜认为 AI 彻底解锁了语言学习中一直无法突破的口语难题,过去几十年的「不可能之事」,现在成了可能。基于此,VisionFlow 推出首款产品 Talkit,一个完全为口语练习打造的 AI x 3D 虚拟世界。 本期内容中,我们会聊产品、聊 AI,我们也会听刘夜分享他从作业盒子到 Talkit 的这段特殊旅程——这其中有关于创业的思考,有面对突然崩塌时的心态调整,以及如何重整旗鼓、再次起航的经验。 我们每个人在一生中都可能面临「人生重启」的关键时刻,希望刘夜的经历,可以给大家带来启发和勇气。 🟢 03:11 快问快答:年龄、毕业院校、MBTI 与星座、一句话介绍公司产品、融资情况、收入与利润、团队规模、本次创业前的探索经历 🟢 05:14 AI + 教育 * AI 来了,为什么我们学英语的方式还停留在上个世纪? * “多邻国是一家专注于‘手’的公司,而我们是一家专注于‘嘴’的公司。” * 一个诞生于 1980 年的语言学习理论(TBLT),为什么直到 AI 大模型出现才真正迎来春天? 🟢 09:12 Talkit:为语言学习打造一个友好的虚拟世界 * 你以为移民到美国那样的真实环境就能学好英语?不,那个世界对学习者并不友好。 * 为了创造一个完美的学习环境,他们自研了一整套“世界生成引擎 (Gen World Engine)”。 * 当 Roblox 还在靠用户创造世界,他们已经能让一个实习生一个月生成 1000 个 3D 虚拟人。 * AI 如何做到既能陪你聊天,又能像个顶级私教一样,精准控制教学内容的难度? 🟢 14:40 伟大的对手:多邻国 一个让很多人抱怨“学不会”的产品,为何能成为市值百亿美金的巨头?它真正的护城河到底是什么? * “解决刚需的生意不算伟大,‘刚需’是农业社会陈旧和腐朽的词汇。” * 多邻国的核心产品哲学:“轻松第一,有效第二”。你永远教不会一个不出勤的学生。 * 绝大多数人使用多邻国,就像去健身房打卡,学习只是一个令人愉悦的“副产品”。 * 多邻国流失的那 8.5 亿用户,都去了哪里?他们都在寻找真正能开口说的方法。 🟢 29:07 双减时刻:从行业清零到内心解脱 一场几乎清零了整个行业的灾难,为何对身处风暴中心的人来说,反而是一种“解脱”? * 双减靴子落地,他和联创通电话,两个人的感受居然都是:“挺好的”。 * 如何判断你的事业是否违背初心?问自己一个问题:“如果我有小孩,会让他用我的产品吗?” * 他曾手握近 10 万个比特币,却为了一份自己认可的教育事业,放弃了成为交易所巨头的机会。 * 如何消化一次创业失败带来的巨大遗憾?答案只有一个:做成一个更伟大的公司。 🟢 36:41 迷茫的三年:一个顶级创业者的“空窗期”生存法则 * 创业中断后,他没有报复性创业,反而陷入了“极度渴望被需要”的状态。 * 一个他调研半年、投资人追着投钱的连锁咖啡项目,为什么在最后关头被他亲手叫停? * “价值不是由功能决定的,而是由独特性决定的。你到底是一个套利的商人还是一个企业家?” * 为什么说创业是反人性的?因为你要去做一些“如果你不做,就没人做”的、足够难的事。 🟢 52:09 用 12 个「我是...」来造句 * 我是高山滑雪全国亚军 * 我是国家二级游泳运动员 * 我是积水潭医院骨伤科常年会员 * 我是全球医生社区会员 * ……剩下的 8 个更精彩,请收听播客 🟢 59:52 一直游到海水变蓝:给新一代 AI 创业者的三个建议 * 创业心法“苦海不苦”:当你能清晰看见远方的蓝海,当下的苦海也就不再痛苦。 * 给 AI 创业者的建议:警惕“假机会”焦虑,真正的机会其实很少,要敢于花时间寻找。 * 拥抱孤独,不要害怕做的事情只有你一个人看到了,因为孤独往往意味着稀缺和正确。 * “只有犯错,才会有机会和自己相处”,才能真正知道什么是对的。 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
在文生图、文生视频的浪潮之外,下一个引爆我们想象力的 AI 技术奇点在哪里?答案可能是 AI + 3D。 本周,我们邀请 3D 大模型公司 VAST 的创始人和 CEO 宋亚宸(Simon),和我们聊聊 VAST 最新 3D 生成大模型 Tripo 3.0 背后的故事。 这位 97 年的创业者短期内连续融资三轮、每轮数千万美金,积攒了足够的子弹,在闷头苦干一年后,Simon 今年首次上播客,和我们探讨了几个关键的战略问题: * 他认为大语言模型已经“撞墙”,进化放缓,这才给了应用和 Agent 繁荣发展的空间。而 3D 大模型则完全不同,它才刚刚起步,仍是一片蓝海。 * 在资源有限的初创阶段,为什么 VAST 「既要又要」?既要研发大模型,又要自己下场开发应用 Tripo Studio? * 为什么科技的终极形态,是一场“解压缩”?他认为人类的媒介史(文字->图片->视频->3D)不是升维,而是因为技术所限,被迫对3D“源文件”世界进行的一次次降维和压缩。技术的进步,就是“解压缩”回世界本貌的过程。 * 以及,在一个机器人能代劳一切的未来,人的价值将如何被重新定义? 从小学时吸引同学们用辣条“充值”自己创造的纸上 RPG 世界,到 all in AI 创业打造一个坚信人人都会创造 3D 的“无限世界”梦想 ——欢迎收听 Simon 在创业路上的观察和思考,也欢迎你在评论区里说说你对 AI + 3D 的想法。 🟢 01:27 快问快答:**年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 02:47 用 10 个「我是 xxx」来造句 1. 我是宋亚宸,也是 Simon 2. 我是 VAST 创始人兼 CEO 3. 我是一个上瘾的游戏玩家(Addictive Gamer) 4. ……剩下的 6 个更精彩,请收听播客 🟢 08:43 Part 1: 万物起源:从小学时收费的RPG,到一个无限世界的梦想 * 3D 大模型创业者的童年:手动创造 RPG 世界,同学们用辣条和豆腐干来“充值” * 核心驱动力:物理世界是有限制的,更大的世界来自于人的大脑、想象和创意的部分,那是一个无限的世界 * 最初的“钉子”:想做一个 UGC 的 3D 内容生态,但发现世界缺少一个大众级别的创作工具——就像文字缺少了输入法,视频缺少了手机摄像头。 🟢 26:14 Part 2: 模型 vs. 工作台:为什么我们既要造发动机,也要造F1赛车? * 一个关键的战略判断:当一个大模型还在以每 3-5 个月一次的速度飞速迭代时,纯做应用层的公司几乎没有生存意义,因为“它给你起了个新墙,你很难受” * 做模型也做做应用(Triple Studio):因为知道下一版模型的迭代方向,知道哪些旧墙应该糊,哪些不用 * 做大模型公司和做产品的本质区别:前者是拿着锤子找钉子,VAST 认为自己从第一天就不是 🟢 28:44 Part 3: AI 2.0 时代的生存法则:语言模型撞墙了,但 3D 没有 * 一个颠覆性观点:为什么现在涌现了大量 Agent 和应用?“我认为是 AI 1.0 时代死了,所以我在做 AI 1.0 的事情。” * AI 1.0 vs AI 2.0:前者是用天才科学家的手工调参训练无数小模型解决长尾问题;后者是用数据驱动训练一个通用大模型去泛化地解决所有问题 * 为什么 3D 领域几乎没有纯应用公司?“因为语言模型撞墙了,但 3D 还没 🟢 57:26 Part 4: 科技的终极形态,是一场“解压缩” * 我们以为互联网是升维(文字->图片->视频),但其实是降维和抽象——因为科技不够发达,我们被迫“压缩”了 3D 世界本来的样子 * 科技越来越发达,其实是允许它越来越解压缩。当它解压缩到极致,就是源文件 * 为什么人人都会做 3D?现在对我们而言很自然的拍视频、发照片,其实也不超过十年 * 3D UGC 平台的市场规模,应该是 Twitter、微博、小红书、抖音、TikTok 等平台加在一起的 2-3 倍 🟢 01:12:21 Part 5: 欢迎来到第四产业:当价值的唯一衡量标准是“体验” * 终极愿景:未来物理世界大部分的事情机器人都可以为人代劳,人的价值在于创意和内容 * 如何衡量价值——“所有的人在所有的时间中,在我们的世界里停留的总量” * 未来的“货币”是算力。你的世界越吸引人,你获得的“钱”就越多,你的推荐算法就越好,你就能创造更好的体验 * 一个来自《上传人生》的隐喻:现实中充的钱越多,虚拟世界就越流畅。未来也是这样,这就是算力 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
今年我们关注了很多面向 ToC 用户的 Agent 产品,本周我们来聊聊面向 ToB 的 Agent,很可能 Agent 创造最大的商业价值不是在 ToC 而是在 ToB。 8 月底,AI Agent 被写入了国务院印发的《关于深入实施“人工智能+”行动的意见》。很多人认为,这是继十年前提出“互联网+”并且我们的生活被外卖、打车等等互联网+服务改变了之后,又一个前沿技术与各行各业结合的新的重要的机遇时刻。 接下来一段时间,「十字路口」也会做一系列相关的内容。 本周,我们关注 Agent 与工业结合正在发生的变化,我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃,和我们聊一聊什么是时序大模型,和大语言模型的区别和具体的案例,他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。 🟢 02:09 快问快答:年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 03:21 时序大模型不是另一个 ChatGPT * 核心概念:大语言模型是跟人对话,时序大模型是跟未来对话 * 它的终极目标是让未来变得可预测、可管理和可优化 * 为什么工业场景需要一个“大”模型?——为了用一个通用模型,泛化地解决各行各业的问题 🟢 11:08 为什么要做? * AI 赋能工业,就像钢铁侠的智能助手贾维斯,我们专注的不是“设计战甲”,而是“生产战甲”的过程管理和控制 * 为什么刚性的自动化产线,依然离不开“老师傅”的临场反应 ? * 一个“数字工人(AI Agent)”最终要替代哪些角色?从设备操作员、运维人员到计划人员,实现从辅助到替代,再到超越 🟢 24:26 怎么做? * 一个反常识的切入点:不依赖对老师傅的访谈,因为人的语言表达会有信息的损失和偏差 * 训练 Agent 依赖什么?“第一性原理”和“永远不会撒谎的数据” * “数字工人”的大脑如何分工?大语言模型负责理解知识、能说会道;时序大模型负责模式识别、因果推理 * Agent 框架如同一个“神经回路”,将大脑、记忆和执行动作封装成一个可控、可观测的闭环流程 🟢 52:02 做出了哪些成果? * 在垃圾焚烧电厂,一个数字工人替代了原先需要 4 班 3 倒的 4 位师傅,实现了“无人值守” * 将技术采购转化为投资逻辑,给客户每年带来 400 到 500 万人民币的增量收益 * 一种颠覆性的商业模式:采用“劳务派遣”逻辑,客户按月为数字工人付工资,费用远低于被替代的人力成本 * 为什么这种模式是可持续的?它平衡了客户前期低投入的需求和供应商连续性收益的保障 🟢 01:09:40 未来呢?AI 会带来工业革命级别的改变吗? * 未来的工作流将如何重塑?人会从简单的操作人员,变成设计者、监督者和创新者 * 当技术工人被解放出来,会发生什么?投入到新工艺的研发中,为企业抓住转瞬即逝的市场风口 * 终极畅想:如果有一天,整个产业链的上下游由数字工人串联起来,其响应速度将带来“工业革命级别的改变” * 给 AI 时代创业者的一个认知:不要只扎根一个行业,而要利用大模型的泛化能力,专注于解决一种“跨行业的同种工艺问题” 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
本周十字路口的嘉宾是一位「榜一大哥」,不是某直播间的榜一大哥,而是 Claude Code token 消耗排行榜上的榜一大哥。 故事是这样的,两周前,Anthropic 上周发布一个公告:他们的工程师在后台数据中发现了一个异常账户,正在以一种不可思议的速度,7x24 小时消耗着 Claude 模型的算力。公告中提到:”有一位用户,在每月200美元的套餐中,消耗了价值 5 万美元的模型使用量。“ 这个消耗量大到,Anthropic 不得不公开发布声明调整全球用户的速率限制。 紧接着,这引发了全球科技圈的猜测和讨论:这个神秘的超级用户究竟是谁?他到底在用 Claude Code 做什么,能产生如此夸张的消耗? 就在所有人都好奇的时候,一个名叫刘小排的中国用户,在 X 上发帖认领了榜一大哥的身份:“Anthropic追杀的那个每个月消耗数万美金的人,原来就是我呀?!” 一瞬间,全球的目光都聚焦到了他身上。 他究竟是钻了系统空子的羊毛党,还是一个将AI潜力发挥到极限的超级玩家?天价账单的背后,隐藏着怎样的秘密? 今天,在「十字路口」,我们有幸请到了这位传说中的‘榜一大哥’——刘小排。他是一位优秀的 AI 创业者,他的三款产品 Raphael AI、AnyVoice、Fast3D 增长迅速、收入可观。 在本期内容中,他将和我们分享惊天消耗量背后的真相,以及作为一个非程序员出身的创业者,他是如何从0到1,利用AI独立完成产品洞察、开发到盈利的全过程。 🟢 03:09 快问快答:年龄、毕业院校、MBTI 和星座、一句话介绍现在的公司和产品、融资情况、收入和利润、团队规模、创业前经历 🟢 04:58 榜一大哥与天价账单 他到底是钻了系统空子的羊毛党,还是一个将AI潜力发挥到了极限的超级玩家? * 究竟用 Claude Code 干了什么成为全球榜一?一个人用77亿的Token,5万美金的账单… * 你为什么普普通通可以消耗到全球第一?背后是不是有一些不普通的用法? * 我们收入很不错,团队就六七个人,利润按照市场价格应该养活三五十人没问题 * 最开始,我以为 Claude Code 只比一个 Cursor 更厉害的 Cursor 而已 * 你怎么看大家说你“滥用规则”这一点? * 我已经过了在乎谁喜欢我、谁不喜欢我的那个年龄了 🟢 08:22 一套“非主流”的AI工作流 * 只要一件事情你敢有 SOP,那一定可以被 Claude Code 自动化 * 除了写代码,它还能做什么?——做 900 种风格的 AI 绘画,我睡了一觉就好了 * 它是一个广义的编程,你说这个是在编程吗?好像是,也好像不是 * 像 Manus 那样的工具是“有限集”;对我来说,Claude Code 是“无限集” * 经验分享:怎么让 Claude Code 不要把代码变成“屎山”? * 认真写需求文档,然后先跟他讨论方案 * 今天一切的创新都是站在前人的肩膀上 * 值得研究的三个进阶功能:后台命令、子 Agent 和输出风格 🟢 23:56 解锁刘小排的十个身份 一个「十字路口」的社交破冰新实验:请嘉宾用十个「我是…」的句式,完成一次“全景式”的自我介绍。 * 我是一个做AI产品的创业者 * 我是产品经理 * 我也是程序员 * 我肯定是个逗逼 * 我的「得到」学分比罗振宇高一分 * 我是 QQ 音乐上认证过的音乐人 * 我是全世界最会用 Claude Code 的人之一 * 我是一个孵化器的联合创始人 * 我是国内比较著名的独立开发者 * 我是“万死不辞打工狗”的精神偶像 🟢 33:30 从猎豹到旷野,一种人生方法论 * 在微软亚洲研究院,我发现了「科技」的秘密原来是两个词:科学和技术 * 猎豹成功的秘诀是他们一直相信简单 * 与 TikTok 前身 Musical.ly 创始人 Louis 做同事:”他居然把 4 个按钮减到 1 个“ * 怎么样扩大自己的运气面积? * 出来混最重要的是什么?是出来 * 多让自己接触到可能更多的变量,总有一些变量能够为你所用 🟢 46:33 创业者的“松节油” * 哪些场景用哪些模型? * 面对最高级的竞赛级别的算法,其实是 GPT 最强 * Gemini 对我来说更像一个架构师的角色 * 在这个时代做产品,和上一个时代有什么不一样? * 很多 AI 产品都很赚钱;但头部的 AI 产品不怎么赚钱,尤其是拿了投资的那些 * 对于那些想积极行动的人,你会给什么建议? * “It is not for you, It is you”——它不是为你而创造的工具,它就是你自己 * 人生是旷野,你有“矿”才能野 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
上周,北京的 WRC 世界机器人大会史无前例的火爆。 维他动力半年内融资 3 亿人民币,带着新产品首次亮相,因其独特性成为了全场最多人排队的展位之一。 维他动力的联合创始人赵哲伦(哲伦班长)很兴奋,他认为: 最多十年,中国的机器人大会也许就可以类比当年的伦敦世博会 ——1851 年的伦敦世博会是第一届世界博览会,在长达 5 个月的展览期内,吸引超过 600 万参观者,展品中也包括引擎、纺织机械等现代工业的标志性创造。 本期节目,我们邀请赵哲伦和我们分享他在世界机器人大会上的见闻,也和我们梳理自波士顿动力发布第一款机器狗至今,机器人行业的的演进与关键技术,以及,他参与创办的维他动力,如何做出第一款摆脱遥控器的机器狗:他们如何做技术路线选择,如何看待今年的目标。 此外,哲伦也和我们讲述了他为什么会离开理想汽车去创业,机器人对孩子的启蒙、机器人文化以及他对未来机器人行业发展前景的预测。 02:05 十字路口 v.s. 哲伦班长 快问快答 03:43 刚参加完 WRC 世界机器人大会的感受 06:28 「最多十年,世界机器人大会也许会成为当年的伦敦世博会」 08:58 归纳机器人意味着什么:它提供了某种程度上的空间移动方式 10:50 从波士顿动力发布第一款机器狗至今,机器人行业演进 11:37 第一阶段:以波士顿动力为主导,第一次让人通过遥控器控制足的行动 12:53 第二阶段:以宇树为代表,结合中国供应链优势,在机器人整体结构上做精巧设计 15:20 今天进入第三阶段,在三个技术成熟的条件下 17:48 宇树科技王兴兴:VLA 是一个相对傻瓜的架构,采用 VLA 架构的维他动力怎么看? 20:03 为什么维他动力选择做机器狗而不是做机器人? 24:03 选 ToC:要交付面对用户服务的产品,联创个人经历,考虑公司的组织方式和工作方法 27:05 研究机器人究竟能为用户做什么:全网找人做用户调研 29:35 第一年追求的关键指标:NPS(Net Promoter Score净推荐值)和出货量 31:38 希望用户可以把维他动力的机器狗带出门 33:18 为什么创业者不选这个领域? 34:11 参考样本少,创业中遇到的意想不到的困难 37:42 机器人创业有两条技能线要走,宇树也有它的挑战 39:46 在理想工作这么久,为什么会考虑创业? 41:30 非常希望自动驾驶有一天能做到 L4 43:29 特别想做机器人,在理想的时候就常常找人沟通 44:22 和李想工作的感受 46:41 创业后和李想聊产品、品牌的收获 49:35 创业选择虽然多,但是也受限,因为最重要的投入就是时间 52:00 也可以靠自己做内容,但希望能找到伙伴做更大的事情 52:58 创业中的起起伏伏 56:04 机器人面向 C 端最有希望并且有商业价值的用户场景会是哪个? 58:31 特斯拉的做法是远程遥控机器人做事再积累数据,这个做法可能只适合特斯拉 01:00:35 业内讨论目前更多关注技术的进一步发展 01:03:10 对今年世界机器人大会最感触的是有很多孩子参与,也许这是他们的机器人启蒙 01:05:03 为什么机器人要去跑步,踢足球?我们需要一种类似汽车文化的机器人文化 01:07:16 现在机器人行业有泡沫吗? 01:12:22 对未来机器人行业的预测,也许会很像《机器人总动员》 欢迎订阅「十字路口」播客 🚦 我们关注新一代 AI 技术浪潮带来的行业新变化和创业新机会。 🚦 十字路口是乔布斯对苹果公司的一个比喻,形容它站在科技与人文的十字路口,伟大的产品往往诞生在这里。AI 正在给各行各业带来改变,我们寻找、访谈和凝聚新一代 AI 创业者和 AI 时代的积极行动者,和他们一起,探索和拥抱新变化,新的可能性。 👦🏻 主播 Koji:我联合创办了街旁/新世相/躺岛,发起了 AI Hacker House 这个新一代 AI 创业者的社群空间。我相信科技尤其是 AI 是我们这一代人最大的价值创造机遇。欢迎大家找我聊天,碰撞想法,链接下一个可能性。Koji 的即刻,Koji 的网站 👧🏻 主播 Ronghui:我在美元 VC 工作过,也做过五年的硅谷驻站记者,关注科技发展和商业故事,欢迎大家找我聊天,和我交流。Ronghui 即刻 🎄 本播客由「新世相声音森林播客计划」支持。
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧