Album

硅谷洞察局

未知 AI-Nate, AI-Siky
6,788 订阅 10 集 4周前
播客简介
创作者
节目
胡正明院士投资、原子级半导体创业者谢学军:摩尔定律走到原子尽头之后,他想给人类文明造一艘"备份方舟"

胡正明院士投资、原子级半导体创业者谢学军:摩尔定律走到原子尽头之后,他想给人类文明造一艘"备份方舟"

硅谷洞察局

🎙️ 硅谷洞察局 EP10 | 胡正明院士投资、原子级半导体创业者谢学军:摩尔定律走到原子尽头之后,他想给人类文明造一艘"备份方舟" 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 当全行业在卷大模型与 Agent 应用的时候,半导体的物理边界正被一群更"硬核"的人重新推开。本期请到 UCSB 半导体博士、连续创业者谢学军——获得胡正明院士(FinFET 发明者、半导体界泰山北斗)的投资(公司网站:phantafield.com)。 他从读 PhD 第一天起就只为创业。论文还没毕业,公司已在 2016 年注册;他赌的是 2D TMD 材料、低温 MOCVD 设备、以及让传统半导体行业做了几十年梦的 monolithic 3D 集成。如今 TSMC、Intel、三星都已公开承认:2D 材料是 1nm 节点之后替代硅的下一代方案。 但这只是他的"白天"。到了"晚上",他在做一件听起来像科幻小说的事——一个叫 The Pantheon(万神殿)的项目:用 wearable + 脑机接口给每个人造一个"数字分身",最终为 10 万人提供无限 Token,作为 AGI 时代的 Human Safeguard。他甚至把这套世界观写成了科幻小说《Pantheon Racing》。 更出人意料的是:这位曾经的纯粹唯物主义者,如今在拜孔子后人中和先生孔众学《大学》《中庸》,认真地用计算机科学的语言重新解释"灵魂是硬件、肉身是 UI"。 从原子级晶体管,到伽马射线激光推进器,再到数字轮回——谢学军在做的事,比大多数人敢想的都更远。 --- 💬 本期金句 "我读博士的动机就是为了创业。" —— 00:03:22 "用原子级的技术推动人类社会进步。" —— 00:05:30 "拿着锤子找钉子才是这个世界创新的真相——大部分人看到的成功故事,都是已经有需求的故事。" —— 00:20:55 "原来只有 100 万人会写代码,现在是 10 亿——这个锤子会砸出更多花样的钉子来。" —— 00:23:09 "AGI 时代,人类要真的想在机器面前活下来,一定要有自己的数字分身。" —— 00:29:15 "灵魂是硬件,我们这具肉身只是一个 user interface。" —— 00:40:38 "AI 是我们对未知世界的一种礼盒——是子集,是模仿,没法触达量子层面背后的东西。" —— 00:51:00 "我比他们更笨,所以我敢想能力以外的事——这反而把我拔高了。" —— 00:59:27 "物理能实现的东西,都不是魔法。" —— 01:07:16 --- 📖 本期术语速查(听到不熟悉的词?翻这里) 2D TMD 材料(二维过渡金属硫化物) 天然只有三个原子厚的半导体材料,代表是 MoS₂(二硫化钼)。像洋葱皮一样可以一层层撕开,表面原子级光滑。被产业公认为 1nm 节点替代硅的下一代方案。 Monolithic 3D Integration(单片三维集成) 把晶体管和互连层一层叠一层做出来,而不是像 HBM 那样在封装级堆叠。传统硅工艺因为高温会破坏下层做不到,2D + 低温 MOCVD 让这个梦想成为可能。 MOCVD(金属有机化学气相沉积) 一种半导体材料生长设备。谢学军公司的核心技术是把它做到能低温、高效、低缺陷地生长 2D TMD。 Thermal Budget(热预算) 芯片制造中各工艺步骤的累计热量上限——一旦超过,前面已做好的晶体管就被破坏。Monolithic 3D 必须低温,这是入场券。 FinFET / GAA(鳍式 / 环绕栅极晶体管) 胡正明院士发明的现代晶体管结构。其本质就是"把沟道做薄"。再往下走的极致,就是用 2D 材料。 PDK(Process Design Kit) 晶圆厂给芯片设计公司的工艺设计套件。谢学军把设备对标 TSMC,用同样的 PDK 设计新材料芯片——是它被产业链快速接纳的关键。 HBM(High Bandwidth Memory) GPU 用的高带宽堆叠存储。谢学军的方向是用 2D 材料做 monolithic 3D 缓存,绕过 HBM 物理堆叠的上限。 The Pantheon 谢学军的数字永生项目。用 wearable + 脑机接口收集个人数据,构建数字分身,以无限 Token 让它"活"下去。最终愿景:10 万人组成的 Human Safeguard,在 AGI 时代为人类文明做备份。 Personal Benchmark(个人基准) 不同于 public benchmark,The Pantheon 给每个用户构建专属基准——只有你最知道镜子里那个 agent 是不是你。 Project-Based Learning(项目驱动式学习) Elon Musk 也在推的学习方式:选定一个方向,在做产品的过程中堆知识。 --- 🗂️ 内容大纲 一、为创业而读博:一条非典型的硅谷路径 读 PhD 第一天就为创业;公司 2016 年注册,论文还没毕业 进入二维材料这个"无人区"——彼时石墨烯、MoS₂ 刚被发现 PhD 导师 Costa Bennett 是胡正明的学生——一脉相承的技术血统 二、说服胡正明院士做投资:一封 cold email 的故事 胡正明读过他第一篇博士论文(2D 材料中的低频噪音),印象很深 技术方向正好是胡正明本人的人生使命——推动摩尔定律继续往前 2019 年第一代低温生长设备做出,2023 年 TSMC/Intel/三星集体跟进 三、2D 材料:把硅切薄会碎,但 TMD 天生就这么薄 为什么 2D 是 1nm 节点之后的必然选择? 亚纳米级量子点阵列:用电子束在 2D 材料上"写"出固态量子点 为下一代 GPU 做 3D 堆叠缓存、航天级抗辐射芯片、XR 透明显示驱动…… 四、Product Market Fit:拿着锤子找钉子,才是创新的真相 低成本 prototype 哲学:display、neuromorphic、quantum、logic 都试一遍 每一代硬盘的故事:是技术先有,需求后到——不是反过来 最重要的创新往往投入很小(参考石墨烯的胶带) 五、AI 时代的"用户即 agent":不是把产品变成 agent,是给每个人一个分身 大多数公司把 agent 当工具/秘书;The Pantheon 把它当你的"复制" 数字永生 → 跨星际人类文明备份 → AGI 时代的 Human Safeguard 为什么是 10 万人?因为单一 AGI 太危险,集体智能才是 safeguard 的统计意义 六、灵魂是硬件、肉身是 UI:当哲学撞上计算机科学 从纯粹唯物主义者,到跟随中和先生彭仲学《大学》《中庸》 轮回 ≈ 大模型训练;游戏角色复制 ≈ 转世;Roger Penrose 的量子大脑 拉马努金的无限公式:AI 永远算不出来——它是被"下载"的 七、给研究者与年轻创业者的建议 知人者智,自知者明——find yourself 是无穷动力之源 读文献之上保留想象力——不要把自己困在"engineering" 不要给自己设限:敢想能力以外的事,本身就是一种拔高 八、五年后再听:还会做同样的决定 挫折就是修行;下一份清单——伽马射线激光器、深空推进、原子级 3D 打印 "物理能实现的东西,都不是魔法" --- 🎤 主播与嘉宾 谢学军 | UCSB 半导体博士,胡正明院士联合创始人;公司聚焦 2D TMD 材料的低温 MOCVD 设备 + 基于 TSMC PDK 的下一代 IP 设计;同时主导数字永生项目 The Pantheon,科幻小说《Pantheon Racing》作者;学《大学》《中庸》,把灵魂当硬件来思考。 AI-Nate | 硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师;前半导体行业从业者(ALD/CVD/PVD/Etch),所以这一期他和谢学军在工艺细节上对得上号。 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 01:27 公司在做什么:低温 MOCVD 设备 + 2D 材料 IP 02:35 为创业而读博:非典型硅谷 PhD 路径 06:30 与胡正明院士的一封 cold email 09:00 为什么 2D:把沟道做薄,硅会碎,TMD 不会 11:25 亚纳米级量子点阵列:电子束在 2D 上"写"出固态 quantum well 15:00 Monolithic 3D:低温 2D 让传统硅做不到的梦想变现实 17:30 Product Market Fit:低成本 prototype 哲学 20:00 拿着锤子找钉子,才是创新的真相 23:00 AI 拉低 Token + 黄仁勋的 10 亿程序员 25:30 The Pantheon 首次公开:数字永生 = AGI 时代的 Human Safeguard 29:00 为什么是 10 万人?集体智能比单一 AGI 更安全 31:00 用金融工具支付未来的 Token 消费 32:00 跨星际文明:光速运送的是意识 36:00 集体意识 / 三体的"3 对人" / 田渊栋《破晓之钟》 40:00 灵魂是硬件、肉身是 UI 43:00 跟中和先生彭仲学儒学:从唯物主义到对意识保持敬畏 47:00 梦中见到从未读过的书:现有物理数学解释不了的"现象" 50:00 各学科的终极是哲学:禅修"正见"与 Yann LeCun 的世界模型 53:00 拉马努金、Roger Penrose 的量子大脑、AI 是"礼盒" 58:00 给 PhD 的三条建议:想象力、不设限、project-based learning 01:05:00 五年后再听:还会做同样的决定 01:06:00 下一份清单:伽马射线激光器 + 深空推进 + 原子级 3D 打印 01:07:00 物理能实现的东西,都不是魔法 / 收尾 --- 📮 联系我们 播客邮箱:[email protected] 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中!扫码进群,和 Nathan 直接聊,认识同样关注 AI、半导体和硅谷动态的朋友们。 --- 📚 嘉宾科幻清单 谢学军把公司未来要做的产品都写进了科幻小说《Pantheon Racing》——原子级技术 × 数字永生 × 跨星际文明的世界观入口。 英文版(Amazon):https://www.amazon.com/dp/B0FCDCZ24S 中文版(豆瓣阅读):https://read.douban.com/ebook/726863167/ --- 🎁 听众福利|AI Superpower 第三期早鸟开放 如果你听完这期心里冒出一个念头——"我也想自己造点东西",那这门课就是为你准备的。 Nathan 在 Maven 开的 3 周直播课《AI Superpower:Build Your One-Person Company》第三期已经开放报名。课程会带你从 0 搭一支属于自己的 Agent Crew,把过去需要一整支团队才能跑的事——写代码、做产品、跑 GTM、做客服——交给 AI 来跑。你只负责给方向、看结果。 适合谁:想做 side project、想跑独立产品、不想等大公司点头才动手的工程师 / 产品人 / 创业者。不需要 AI 背景,需要的只是想动手的那点冲劲。 📅 6 月 8 日开课 · 共 3 周 · 直播 + 录播 🎟️ 早鸟票 EARLYBIRD20 八折,5 月 11 日截止 👉 报名:https://maven.com/ai-nate/ai-superpower?promoCode=EARLYBIRD20

68分钟
99+
4周前
前 DeepMind 研究员、前百度无人车负责人:每个人都将成为 CEO,AI 会拥有 100 台云电脑

前 DeepMind 研究员、前百度无人车负责人:每个人都将成为 CEO,AI 会拥有 100 台云电脑

硅谷洞察局

🎙️ 硅谷洞察局 EP09 | 前 DeepMind 研究员、前百度无人车负责人:每个人都将成为 CEO,AI 会拥有 100 台云电脑 一线洞察,深度思考。硅谷核心科技从业者,带你触摸 AI 变革深处。 --- 📌 本期看点 当 OpenAI、Anthropic 还在卷大模型,市面上人人都在做 Browser Use 和 API Agent 的时候,有一家硅谷创业公司,从 2023 年成立第一天起就只啃一块最硬的骨头——让 AI 像人一样,用鼠标和键盘真正地"操作"电脑。 这家公司就是 Simular AI,创始人李昂——前 DeepMind 研究员、前百度阿波罗北美无人车团队负责人。本期我们请到他,聊聊为什么他们要选择最难、最反直觉的那条路,以及今年 3 月发布的新产品 Sai (赛) 背后的世界观:每个人都将成为 CEO,云端会有 100 台电脑同时为你工作。 这是一场关于 Computer Use Agent 本质、AGI 路线图、和创业反共识的深度对谈。 --- 💬 本期金句 "如果一件事情真的非常顺其自然,那一定是有问题的——因为我们觉得顺其自然,其他人也会觉得。" —— 00:38:08 "agent 的对手是人类世界——是人的生活习惯。" —— 00:44:46 "创业公司很多成功,都是因为他没有尝试去改变(用户),而是在已有工作流上提升。" —— 00:45:33 "先打平人,你再谈怎么超越——你连鼠标都点不了,还谈什么 AGI?" —— 00:47:00 "AI 如果想更进一步,首先应该先假设自己是人,去做这些事,再谈别的。" —— 01:14:43 "最终每个人都会变成公司 CEO,你会有 100 台云电脑帮你做事。" —— 00:31:00 "DeepMind 不能 own 产品——这就是我必须出来创业的核心原因。" —— 01:13:00 "最终极的产品就是:我都不知道它存在,但它把事情帮我做了。" —— 01:30:53 --- 📖 本期术语速查(听到不熟悉的词?翻这里) Computer Use Agent(电脑操作智能体):能像人一样移动鼠标、敲键盘、点击屏幕来完成任务的 AI Agent。区别于只调用 API 的 Agent。Simular 是这个赛道全球最早的玩家之一。 Browser Use Agent(浏览器操作智能体):专门在浏览器里点链接、填表单、抓数据的 Agent。门槛比 Computer Use 低,做的人多。 OS World:学术界评估 Computer Use Agent 能力的标准 Benchmark,几百个真实操作系统任务(Word、Excel、Chrome 扩展安装等)。Simular 在 2024 年 12 月成为全球第一家在该榜单上达到人类水平(72.4 分)的公司。 Pass@K vs Pass^K:两种衡量 Agent 成功率的方式。Pass@K 是"K 次中至少 1 次成功",适用于写代码;Pass^K 是"K 次必须全部成功",一次错就算错——这才是真实业务场景需要的可靠性标准。 Sai(赛):Simular 在 2025 年 3 月发布的产品——给每个人在云端配一台 Windows PC,Agent 可以 7×24 替你操作它。现在已经支持自带电脑,一个 workspace 可以挂多台。 Always-on Co-worker(永远在线的同事):Sai 的产品定位,不是工具,而是一个不会下班的 AI 同事,在云端持续替你工作。 Harness Engineering(执行框架工程):管理 Agent 任务流、上下文、出错恢复的"脚手架"。Simular 在 2024 年 10 月开源了业界第一个 Computer Use Agent Harness——比 Anthropic 的 Computer Use 早了一周。 MCP vs CLI:MCP(Model Context Protocol)是为 Agent 专门设计的协议;CLI 是给人用的命令行。本期讨论:为什么 2024 年大火的 MCP 在 2025 年被 CLI 反超?——因为大模型是用互联网上(为人写的)数据训练的,CLI 数据多到爆。 Lifelong Learning(终身学习):李昂在 DeepMind 时期的核心研究方向。AGI 必须像人一样实时学习——白天像 Harness 不停记笔记,晚上 replay 训练改变权重。 --- 🗂️ 内容大纲 一、Simular 的"反共识"基因 2023 年第一个 Demo:CEO 在机场远程操控发布会现场的电脑 为什么不做 Browser Use 也不做 API?——故意挑最难的 2024 年开源 Agent Harness:比 Anthropic Computer Use 早一周 二、Computer Use 的本质与难点 GUI 不会消失——这个世界的基建是为人造的,Agent 必须适应 视觉定位、长工作流的累积错误、Pass^K 的可靠性陷阱 为什么打款多 10 倍这种错误,99% 成功率也无法容忍 三、OS World 人类水平意味着什么 李昂团队 2024 年 12 月达到 72.4 分,首次平人 但这只是研究里程碑,真实场景需要 Multi-turn 交互、Human-in-the-loop God Will 机制:Agent 在不可逆操作前必须停下来等审批 四、Sai 产品哲学:云端 100 台电脑 每个人都成为 CEO,云端会有 100 台电脑同时工作 为什么选 Windows?——全球最大装机量 + 微软合作 跟微软是 Frenemy:都做 AGI,但产品 DNA 不同 惊喜 Use Case:Fund Manager 自动 monitor 投资组合、二手车 Dealer 批量处理 100 张 DMV 注册 五、为什么 Computer Use > API 不是所有软件都会 API 化(老旧系统、DMV……) Vibe Coding 让 GUI 也变多了——API 和 GUI 是同时增长的 人不是机器——视觉信息维度更高,GUI 是有用的 人最终为结果负责,不可能把所有 permission 全交给 Agent 六、MCP vs CLI 的逆转 为什么"为 Agent 设计的 MCP"被"为人设计的 CLI"打败? 数据决定一切——大模型在互联网数据(全是为人写的)上训练 AI 想进步,先假设自己是人 七、Token 浪费与 ROI 困境 Nathan 一天烧 600 美金、推特账号被 Agent 群发禁掉的真实经历 ROI 太低=资源浪费,这是限制下一个 10 倍的最大瓶颈 模型能力会持续提升,但 efficiency 还远远不够 八、从 DeepMind 到创业:为什么必须出来 2016 年 Facebook AI Research 已经预见 Scaling Law DeepMind 不能 own 产品 → 没有完整闭环 → AGI 实现不了 终身学习需要 Agent + 用户反馈 + reflection 闭环——大厂里搭不起来 九、给 AI 研究员/大厂员工的建议 Storytelling 能力:把图像式的想法转换成逻辑语言 Apple 的细节执念:VP 会亲自把午餐三明治按种类分类 写代码烂大街了——人的价值在 design taste、product sense、对细节的把控 每个人都得 generalist:程序员要懂产品,设计师要会写代码 十、推荐产品:Granola(管它拉) 为什么记笔记这么"小"的产品能打动一个 CEO 无声的产品形态——不需要 Chatbot 那种"陌生人开场白"的尴尬 最好的产品:用户感知不到它的存在,但事情都被做了 --- 🎤 主播与嘉宾 李昂 | Simular AI 创始人 & CEO,前 Google DeepMind 研究员(终身学习方向),前百度阿波罗北美无人驾驶团队负责人,前Facebook AI 研究员。Computer Use Agent 赛道全球最早的开拓者之一。 AI-Nate | 硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师 AI-Siky | 斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍:Simular AI 创始人李昂 00:43 2023 年的第一个 Demo:CEO 在机场操控发布会现场 03:30 业界第一家 Computer Use 公司——比 Anthropic 早一年 06:00 为什么 Simular 不自己训练大模型? 09:00 Computer Use 的本质:让电脑自动化,而非只是鼠标键盘 12:00 视觉定位、长工作流——为什么 Agent 难 14:00 Pass@K vs Pass^K:打款多 10 倍就要被开除 16:00 API 和 GUI 的辩论:为什么不只用 API? 19:00 为什么人和 AI 应该和谐共存,而非完全替代 22:00 OS World 72.4 分:研究里程碑 vs 现实落地 25:00 Multi-turn 交互 + Human-in-the-loop = 真实场景 28:00 Nathan 真实案例:推特被 Agent 刷屏导致封号 31:00 Sai 的产品哲学:每个人 100 台云电脑 34:00 反直觉创业战略:不做 Low-hanging fruit 38:00 创业公司一定要找别人解不了的难问题 40:00 用户惊喜:Fund Manager + 二手车 Dealer 的真实 Use Case 43:00 GUI 不会消失——基建是为人造的 46:00 创业核心洞察:Agent 的对手是人类的生活习惯 47:00 AGI 路线图:先打平人,再谈超越 48:00 MCP 为什么被 CLI 反超?——数据为王 51:00 微软合作:Frenemy 关系如何处理 54:00 下一个 10 倍的瓶颈:Token 效率与 ROI 57:00 Nathan 烧 600 美金的故事 & Token 优化心得 01:00:00 终身学习:从 2016 Facebook 到 DeepMind 的研究主线 01:05:00 进化算法 + 强化学习——为 AGI 铺路 01:08:00 人脑假说:白天做 Harness,睡觉时 Replay 训练 01:13:00 为什么必须离开 DeepMind:大厂不能 own 产品 01:16:00 给 AI 研究员的建议:学会 Storytelling 01:19:00 Apple 4 年的 Lesson:对细节的执念 01:22:00 写代码烂大街后,人的价值在哪? 01:25:00 generalist 时代:每个人都要变 CEO 01:28:00 推荐产品 Granola:无声的产品形态 01:32:00 结语 & 感谢 --- 📮 联系我们 播客邮箱:[email protected] 欢迎评论区留言交流,转发支持! --- 🎙️「硅谷洞察局」听友群开放中! 👉 扫码进群,和 Nathan、Siky 直接聊 🎯 告诉我们下期你想听什么 🤝 认识同样关注 AI 和硅谷动态的朋友们 --- 🎁 听众福利 👉 试用 Sai:simular.ai(支持邀请码注册) 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程——从零开始,用 Cursor + Claude Code 搭建你的第一个 AI 项目。不需要编程基础,跟着做就行。 👉 免费报名:Agentic Coding Zero-to-Shipped

92分钟
1k+
1个月前
AI视频赛道硅谷领跑者HeyGen副总裁:一路狂奔拿下的最强商业落地方向

AI视频赛道硅谷领跑者HeyGen副总裁:一路狂奔拿下的最强商业落地方向

硅谷洞察局

🎙️ 硅谷洞察局 EP08 | AI视频赛道硅谷领跑者HeyGen副总裁:一路狂奔拿下的最强商业落地方向 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 AI 数字人已经不是科幻——阿根廷总统米莱用它做 175 种语言的全球演讲,宝格丽用它做全球员工培训,一条本来要好莱坞团队、10 万美金、4 周才能做出的品牌片,现在一句 prompt 就能生成。 本期嘉宾是硅谷 AI 数字人头部公司 HeyGen 的工程副总裁刘斌——硅谷 15 年,Pinterest 近 10 年做到 Director。去年他带创业团队整体加入 HeyGen,理由很简单:AI 时代,小公司已经招不到顶尖人才了。 就在我们录完节目的第二天(4 月 18 日),HeyGen 开源了节目里深聊的新项目 HyperFrame ——让 AI 用"写代码"的方式做视频——一夜之间在 X 刷屏。这期节目帮你了解这场风暴幕后的故事。 我们聊了:为什么所有 AI 创业公司都可能被 AGI 一把抹掉、HeyGen 员工的 Slack 一半是真人一半是 AI、以及一个最扎心的问题——当 AI 可以 24 小时替你出镜,内容创作者还剩什么? --- 💬 本期金句 "沟通视频是一个极其巨大且极其 underserved 的市场——它不 sexy,但远远没被开发。" —— 00:17:56 "除了英语之外,什么是 Agent 的母语?就是 Code。" —— 00:21:48 "视频编辑这件事,如果用 AI Native 的方式做,它不是 Editing Problem,是 Codegen Problem。" —— 01:03:18 "不只是 HeyGen,任何 Startup 都有可能被那个最先达到 AGI 的公司 wipe out。" —— 00:30:50 "Canva 没有技术护城河——但它有 2.5 亿月活。为什么?" —— 00:32:02 "我们通宵干了 48 小时,仍比别人慢 4 小时——在 Twitter 上可能就少了 50 万播放。" —— 00:37:34 "招一个人最重要的一点:你能不能成为这家公司的一个 Pivot Point。" —— 00:58:58 "在一个人的 career 里,能做一件真正定义一个行业的事,是极其难得的。" —— 01:07:31 --- 📖 术语速查 Avatar / AI 数字人:AI 生成的虚拟人,能模仿真人脸、声、表情——抖音、视频号里很多"主播"就是 Avatar。 HyperFrame(HeyGen 4/18 刚开源):Hypertext + Frame。让 AI 用"写网页代码"的方式做视频,节目录完第二天在 X 上刷屏。 AGI Wipe Out:AGI 一旦出现,很多今天有护城河的公司会瞬间失去价值。刘斌坦言 HeyGen 也不例外。 Seedance 2.0 / Veo 3 / Kling:当前最强的 AI 视频模型,分别来自字节、Google、快手。HeyGen 是 Seedance 2.0 北美独家整合平台之一。 Land Grab Mode:硅谷 AI 行业现在的状态——谁先上线、谁先占据用户心智,谁就赢。 Unit Economics:每获一个用户赚多少、花多少。AI 产品每次用都烧算力钱——这也是 OpenAI Sora 关停消费端的核心原因。 Pivot Point:刘斌招人哲学——一个人出现就能改变公司走向的人,才值得高薪抢。 --- 🗂️ 内容大纲 一、从 Pinterest 到 HeyGen:一个硅谷老兵的再出发 - 硅谷 15 年,Pinterest 近 10 年管产品+设计+工程 - 自己创业 2 年后带团队整体加入 HeyGen - 决策逻辑:AI 时代小公司招不到顶尖人才 + 行业正在整合(Graphite→Cursor、Windsurf→Google) 二、HeyGen 做的不是好莱坞,是"沟通视频" - 别人都在打 cinematic,HeyGen 打 Avatar + 沟通场景 - 客户案例:阿根廷总统米莱、宝格丽 - 14 天把一段内容分发成 175 种语言 三、Code as Video:HyperFrame 的秘密 - Agent 不擅长用 Premiere / AE(为人设计的)也不会改 XML - 视频本质 ≈ 一个带动效的网页 → 让 Agent 直接写 HTML 代码 - 一条 10 万美金、4 周的好莱坞品牌片,现在一句 prompt 搞定 四、为什么 HeyGen Avatar 比 Veo 3 / Sora 更适合商用 - Veo 3 每 8 秒开始"drift"(人物走样),HeyGen 通过复用关键帧解决 - 1 分钟视频成本 < 1 美元(Veo / Seedance 8 秒就要 1 美元) 五、AGI Wipe Out:应用层的生存哲学 - HeyGen 也可能被抹平——任何 Startup 都会 - 应用层 baseline:比 OpenAI 更懂用户(CEO 每天聊 1 个客户) - 长期必须做 network effect——Canva 靠模板生态,不是技术 - Cursor 的危机:Claude Code、Codex、Antigravity 都在抢它蛋糕 六、Land Grab Mode:硅谷现在拼的是速度 - Seedance 2.0 上线,HeyGen 是 4 家拿到首批 API 的公司之一 - 慢 4 小时 = 少 50 万播放 - HeyGen 霸榜时间线:Video Translate → Avatar IV → Video Agent 七、Sora 为什么关停?AI 消费产品的致命难题 - 传统消费互联网边际成本为零,AI 产品每次使用都烧算力 - 解法:Edge Computing + 小模型 + 高性能终端,2-3 年可期 - 为什么工具向 AI 产品成功率更高:LTV 算得清楚 八、AI Native Workforce:HeyGen 内部怎么运作 - 公司 Slack 一半是 Agent、一半是真人 - 用代码、网页、视频替代 PPT 和 Doc 做内部汇报 - Incident Review 压缩成 1 分钟视频,工程师上厕所就能看完 - 招人只看一点:你能不能成为公司的 Pivot Point 九、两个 Big Bets & 创业者的初心 - Bet 1:HyperFrame 开源成为 AI 视频时代的事实标准 - Bet 2:Avatar Identity 成为一个全新的资产类别 - 动力:"能做一件 define industry 的事,是极其难得的" --- 🎤 主播与嘉宾 刘斌|HeyGen 工程 VP:硅谷 15 年,Pinterest 早期员工并工作近 10 年至 Director;CMU 校友,与 HeyGen CEO 张帅是大学同班同学;自己创业 2+ 年后带团队整体加入 HeyGen。 AI-Siky:斯坦福毕业,10 年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人。 AI-Nate:硅谷 AI 工程师,18 周打造 18 个 AI Agent 产品,AI 课程导师。 --- ⏱️ 时间戳 00:00 开场 & 嘉宾介绍 02:00 为什么从自己创业转向加入 HeyGen 06:40 HeyGen 做的不是好莱坞,是企业沟通视频 07:30 客户案例:阿根廷总统米莱、宝格丽 10:00 Avatar IV:14 天分发 175 种语言 17:30 "Code 是 Agent 的母语" 18:30 HyperFrame 揭秘:视频 = HTML 代码 22:00 10 万美金品牌片 vs 一条 Prompt 23:00 Avatar 为什么比 Veo 3 更适合长视频 27:30 Foundation Model vs Application Layer 的博弈 30:50 "任何 Startup 都可能被 AGI Wipe Out" 32:00 Canva 护城河不是技术,是模板生态 35:00 Land Grab Mode:Seedance 2.0 抢先上线 37:34 "通宵 48 小时仍慢了 4 小时 = 少 50 万播放" 46:30 Sora 为什么关停:AI 消费产品的 Unit Economics 难题 56:47 上一波(Pinterest/Uber)vs 这一波 AI 创业体感 58:58 招人哲学:能不能成为 Pivot Point 59:30 AI Native Workforce:Slack 一半是 Agent 01:03:18 "视频编辑是一个 Codegen Problem" 01:03:50 两个 Big Bets:HyperFrame + Avatar Identity 01:07:55 "我不想停下来,我也永远不会停下来" 总时长:约 1:10:00 --- 📮 联系我们 播客邮箱:[email protected] 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中!扫码进群,告诉我们下期你想听什么。 --- 🎁 听众福利 想亲手体验节目里的 Code as Video、AI Native Workforce?Nathan 在 5 月 2 日(周六) 开一场 2 小时动手工作坊——「Build Your First AI Agent in 2 Hours」,用 Cursor + Claude Code 搭建你的第一个 AI Agent。不需要编程基础。 听众专属:优惠码已嵌入下方链接,立享 20% OFF 👉 maven.com

69分钟
99+
1个月前
硅谷天才少女CEO如何在AI多模态应用实现增长奇迹 - 三年近亿美金营收

硅谷天才少女CEO如何在AI多模态应用实现增长奇迹 - 三年近亿美金营收

硅谷洞察局

🎙️ 硅谷洞察局 EP07 | 硅谷天才少女CEO如何在AI多模态应用实现增长奇迹 - 三年近亿美金营收 一线洞察,深度思考。硅谷核心科技从业者,带你触摸AI变革深处。 --- 📌 本期看点 当所有人都在谈论 AI 创业时,有一个华人女性创始人已经悄悄把事情做成了。本期,我们来到 OpenArt 的 Hacker House 现场,对话 CEO & Co-founder Coco Mao(毛科淳)——前 Google 7年老兵,卡耐基梅隆大学本科计算机出身,2022年创办 OpenArt,三年做到近亿美金 ARR、800万月活用户。 她聊了很多"不那么光鲜亮丽"的真实创业故事:为什么在 GenAI 时代"拿着锤子找钉子"反而是对的?为什么不要过早定义 ICP?为什么 Startup 不是死于竞争,而是死于自杀?以及,她正在筹备的 5 月重磅产品发布——一个 Agentic 的端到端视频创作体验。 这不是 PR 稿里的创业故事,是在 Hacker House 里、身边工程师还在加班时录下的一线实录。 --- 💬 本期金句 "在 GenAI 领域创业有点 counterintuitive——你不要过早定义你的 ICP,因为技术在变,市场在变,过早框死自己会 miss opportunities。" —— 06:22 "团队之间有问题,morale 不好,这才是真正杀死你的东西。" —— 39:57 "当 model 越来越强大的时候,你应该感到 excited 还是害怕?这个问题能告诉你,你的产品到底是不是在跟 model 竞争。" —— 19:51 "以前每周都换一个 idea,做了一周 prototype 就上线——三个月后 ChatGPT 爆了,我们才觉得这个东西好像是有点什么东西的。" —— 15:30 "我们想做 AI 时代的 Canva——不是专门给 professional filmmaker 用的,而是让 non-professional 做出 professional 质感的内容。" —— 29:00 "如果你在想「我是不是应该 fire 这个人」,想了大概三次,那估计就是你应该 fire 的。" —— 45:54 "你要想象加州淘金热——在水里的人比在岸上看的人更可能挖到金子。身处其中,你才能观察到机会。" —— 54:01 --- 📖 本期术语速查(听到不熟悉的词?翻这里) ICP(理想客户画像) 你最想服务的目标用户群体。传统创业建议是越早定义越好,但 Coco 认为在技术剧变期不要过早框死。 Micro Pivot(微转向) 不是大的战略转型,而是根据技术发展和市场反馈做出的小幅方向调整。OpenArt 每年都会做几次 Micro Pivot。 Visual Storytelling(视觉叙事) 用图像、视频等视觉手段讲故事。OpenArt 的核心 mission 是让人人都能做视觉叙事。 Model Aggregator(模型聚合器) 整合多个 AI 模型(如 Flux、Stable Diffusion、Veo 3 等)供用户选择使用的平台。Coco 认为纯聚合价值有限,需要在此之上构建更多工作流价值。 Agentic Workflow(智能体工作流) 让 AI Agent 自主完成端到端的创作流程(脚本撰写→素材生成→后期编辑),而非让用户逐步手动操作。OpenArt 2026 年的核心方向。 Node-based Workflow(节点式工作流) 类似 ComfyUI 的可视化编排方式,用户拖拽节点构建工作流。Coco 认为这更适合 professional,不符合 democratize 的 mission。 World Model(世界模型) 能理解和模拟 3D 世界的 AI 模型。OpenArt 接入了李飞飞团队的 World Labs 模型,推出 Open Worlds 功能,让用户在虚拟世界中选取角度和运镜。 Beat Sync(节拍同步) AI 分析音乐节奏后,让视频画面切换与音乐节拍精确同步。OpenArt Music Video 产品的核心技术之一。 Go-to-Market / GTM(市场进入策略) 产品如何触达用户、获取增长的策略。OpenArt 早期靠 SEO 和域名优势冷启动,后扩展到 Influencer Marketing、社媒运营等多渠道。 SMB(中小企业) OpenArt 的重要用户群体之一。这些企业需要在社交媒体上运营账号、制作内容,但通常没有专业设计或视频团队。 --- 🗂️ 内容大纲 一、从谷歌到创业:前谷歌人的AI创业起点 • 卡耐基梅隆大学本科计算机 → 谷歌7年 → 2022年8月创办OpenArt • ChatGPT爆发前三个月入场,每周换一个想法快速验证 • 技术巨变时代,"拿着锤子找钉子"反而可行 二、不要过早定义目标用户 • 技术和市场都在变,过早框死会错过新兴人群 • 从"什么人都来生图"到聚焦视觉叙事的演进 • 以不变应万变:抓住人类不变的表达欲和叙事需求 三、三年三次微转向:图片 → 视频 → 智能体 • 2022-2024:图片生成起步,搜索优化冷启动 • 2024试水视频 → 太贵质量不够 → 砍掉;2025视频模型突破 → 重新投入,爆发增长 • 2026:全力押注智能体工作流,5月重磅发布 四、模型越强,我们越兴奋——护城河思考 • 纯模型聚合价值有限,真正价值在端到端创作链路 • 电影类比:视频模型只是摄影师,还需要编剧、剪辑、音效 • 坦诚反思:工作流层面很难有壁垒,需要生态和飞轮 五、对标Canva:普惠化的产品哲学 • Canva七成用户不是设计师 → 让普通人做出专业质感 • 节点式 vs 智能体驱动:选择后者,测试效果更优 • 音乐视频:上传一首歌 → AI分析歌词节奏 → 自动生成MV 六、Sora关闭、世界模型与竞争格局 • Sora关闭是OpenAI自身战略调整,视频市场依然很好 • 模型公司做内容平台行不通:基因不同,缺运营 • 接入李飞飞团队世界模型,推出虚拟片场功能 • 不担心大公司,更关注其他创业公司——迭代速度是优势 七、增长飞轮:从百万到接近一亿美金 • 百万 → 千万(12个月)→ 1700万(2025)→ 接近一亿(2026) • 增长是阶梯式的:找到爆发点 → 平缓 → 再找点 → 再爆发 • 获客矩阵:搜索优化 → 网红营销 → 社媒运营 → 广告 八、团队治理:快速淘汰、不要过度优化、找对人 • "想了三次要不要开这个人,那就该开了" • 管理随规模迭代:5人无流程,10人建流程,50人学放权 • AI改变团队结构:以前20个工程师,现在4-5个就够 • 最好的人才来自熟人推荐,不是猎头 九、未来愿景:从工具到生态 • 目标上市,不考虑被收购 • 短期深耕工具,视频是万亿美金市场 • 长期探索AI原生的消费体验,从工具变生态 • 5月重磅发布 + 101高速公路广告牌已预定 --- 🎤 主播与嘉宾 Coco Mao(毛科淳)| OpenArt AI CEO & Co-founder,卡耐基梅隆大学本科计算机,前 Google 7年(搜索 / Area 120 / Tangi),ACM ICPC Top 10,LinkedIn Women in Tech Scholarship。2022年创办 OpenArt,三年做到 800万月活、近亿美金 ARR、50人团队。 AI-Siky | 斯坦福毕业,10年+硅谷经验,曾主导多家独角兽增长,现任顶级科技公司战略合作负责人 AI-Nate | 硅谷AI工程师,18周打造18个AI Agent产品,AI课程导师 --- ⏱️ 时间戳 00:00 开场介绍 00:43 嘉宾自我介绍:谷歌7年到创办OpenArt 01:15 营收增长历程:从百万到接近一亿美金 03:04 用户画像:受众远比想象中广 04:34 音乐视频产品:节拍同步与歌词分析 05:27 今年方向:从单个素材生成到端到端智能体 05:45 三年创业历程拆解 06:17 反直觉:不要过早定义目标用户 08:32 以不变应万变:为什么聚焦视觉叙事 11:56 拿着锤子找钉子,在技术巨变时代反而可行 14:00 获客策略:搜索优化冷启动与网红营销 15:24 创办三个月后ChatGPT爆发,乘上浪潮 16:16 从图片到视频:竞争与市场空间 17:07 几个关键微转向节点 17:44 增长不是线性的:爆发→平缓→再爆发 19:17 大模型厂商下场做工作流怎么办? 19:50 模型越强,你是兴奋还是害怕? 21:28 电影制作类比:模型只是摄影师 24:04 诚实反思:工作流层面很难有护城河 25:00 速度是最大优势 27:33 节点式还是智能体驱动? 29:00 对标Canva:七成用户不是专业设计师 32:33 Sora关闭意味着什么?视频市场依然很好 35:12 世界模型与虚拟片场 37:15 不担心大公司,更关注其他创业公司 39:27 创业公司不是死于竞争,而是死于内耗 40:33 招人三标准:好奇心、学习力、主人翁意识 42:23 AI改变团队结构:工程师要有产品思维 44:40 管理随规模迭代,不要过度优化 45:33 招错人怎么办?想了三次就该开 47:33 从事无巨细到学会放权 48:33 未来愿景:上市,从工具走向生态 50:33 寻找AI原生的消费体验 53:33 淘金热类比:在水里的人才能挖到金子 55:00 五月重磅发布预告 55:56 招聘联系方式 56:23 结语 --- 📮 联系我们 播客邮箱:[email protected] OpenArt 招聘:[email protected] 欢迎评论区留言交流,转发支持! --- 🎙️ 「硅谷洞察局」听友群开放中! --- 🎁 听众福利 想亲手体验 Vibe Coding?Nathan 开设了一堂免费快闪课程 👉 免费报名:Agentic Coding Zero-to-Shipped

56分钟
1k+
1个月前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧