66.直击GTC现场:与姚欣、季宇盘点英伟达的野望,与2026 AI Q1季报
卫诗婕|商业漫谈Jane's talk

66.直击GTC现场:与姚欣、季宇盘点英伟达的野望,与2026 AI Q1季报

135分钟 3.87万 2个月前
节目简介
来源:小宇宙
一年一度的英伟达GTC大会在美西时间3月17日上午11点于加州圣何塞开幕。
开幕前夕,小龙虾Openclaw掀起的Agengt热,着实为本届GTC带去了空前的热度。 AI 正走过奇点,AI 基建会发生怎样的变化?
一期一会,我又邀请了《漫谈》的老朋友,PPIO 派欧云创始人姚欣 Bill 返场。去年GTC,Bill 和我考古了英伟达的30年成长史和精彩的算力风云,如果是对英伟达毫无了解的朋友,欢迎先前往漫谈的第28和29期节目补补课,那是一段非常精彩的商业史。
今年,Bill 在 GTC 开幕前与我录制了这期播客,他的导读不仅标出了本届 GTC 的看点,也涵盖了 2026 Q1 的 AI 动向季报。
而为了更准确地理解本届 GTC 的亮点和技术趋势,我又找到了这期节目的第二位嘉宾,国产 GPU 行云的创始人季宇,季宇博士是芯片行业专家,也是华为天才少年,参与过华为昇腾芯片项目,2024 年正式开始芯片创业。他会为我们校准本届 GTC 老黄开幕演讲中,一些新产品亮相(也有一些产品消失~)背后的产业逻辑与风向。
特别说明,本期节目不构成任何投资建议。
本期嘉宾:
姚欣 (PPIO 派欧云创始人兼CEO )
季宇(行云集成电路创始人兼CEO)
本期Shownotes:
Part 1. 对姚欣的访谈:在GTC开始前2小时,押题本届GTC的看点
04:54 算力需求井喷:谷歌半年时间 TOKEN 增长超过 13 倍
06:22推理爆发:Scaling Law 逐渐后移,Agent 时代来临
09:00 奇点已至
11:59 英伟达收购Groq,与万众瞩目的 LPU
15:49 模型与应用厂商趋势:长程任务、个性化智能、多模态适应
21:18 Ruby 系列芯片进化对算力行业的影响与趋势
24:56 AI工厂建构中,光互联将成半导体热点
34:52 Gemini、Claude 崩溃:中东战争,如何影响了全球AI服务?
38:08 如何理解英伟达五层蛋糕理论?
45:56 AI 进入加速时代:硅谷情绪乐观,投资人决心重来一遍
01:02:13 Agent OS、开闭源竞争、与半导体产能
01:10:41 从benchmark 到衡量替代人力产能的ROI:AI 正式走向应用时代
01:14:55 一超多雄格局,与费曼架构看点
Part2. 与季宇观看黄仁勋演讲直播:英伟达的野望、AI大型机器时代与一些问号
01:19:07 行云在做的事,与英伟达的关系
“看完GTC只有一个感受,琳琅满目”(这是一种褒扬吗?)
01:21:26 IBM 与英伟达,以及 AI 的大型机器
01:24:49 AI工厂,与五层蛋糕
01:25:21 激进的LPU:高并发时可能存在隐患,英伟达方案的错配
01:42:04 TPU、LPU与GPU在推理层面的应用分析
01:47:31 Agent 时代的算力需求
01:53:47 大型机与普惠机的鸿沟:英伟达一路狂奔而去
01:59:51 消失的 CPX:半导体产能紧俏后遗症
02:02:21 Nvidia 的小心机:异构堆叠与非标产品推广
02:11:27 “LPU 是我唯一看不懂的英伟达的选择”
02:12:36 “去年是 amazaing 的一年”
推荐阅读:《季宇:困在“大型机”里的AI产业》
加入听友群👇
小宇宙热评
是sia不咯
2个月前 广东
28
一些词语/背景解释,边听边查kimi记录的。适合像我这样的普通听众,没听明白的时候看: 奇点: 它指的是一个技术临界点——当人工智能的智能水平达到并超越人类智能时,技术进步将呈指数级爆炸式增长,人类社会将发生根本性变革。最早由计算机科学家冯·诺伊曼提出,后经未来学家雷·库兹韦尔(Ray Kurzweil)发扬光大。 SRAM: Static Random Access Memory,静态随机存取存储器。 为什么Groq用SRAM做AI推理? Groq 是一家做AI推理芯片的独角兽,他们的核心设计就是:用大量SRAM替代HBM(高带宽内存),其路线是"用钞能力换速度"——SRAM贵,但延迟极低。如果NVIDIA能把这种思路融合进GPU,就能兼顾通用性和推理速度。 DRAM: Dynamic Random-Access Memory,动态随机存取存储器。 LPU: Language Processing Unit(语言处理单元)。这是Groq专门为大模型推理设计的专用芯片。专为大模型对话推理设计的"加速器"。 * 特点:用的sram, IO存储高,吞吐率高,同时价格也很高。 * 特定场景:极高吞吐,极强稳定性,且贵。如ai coding。 长程任务: Long-horizon tasks,指需多步骤、长时间、持续执行的复杂任务。非常典型的给agent这一类的场景,做长时间任务模拟。 如:openclaw小龙虾;athropic的coworkers,自动接管你的桌面,做很多任务的整理,帮你处理excel的报表。(引发saas软件末日论) NCP: 英伟达合作伙伴,NVIDIA Cloud Partner。 星际之门铁三角的循环投资: OpenAI、英伟达、oracle。英伟达投openAI做 模型,甲骨文提供云计算,买英伟达芯片。(62期年终总结提到过) 英伟达的五层蛋糕: * 第5层:AI应用(ChatGPT/Cursor等) ← 英伟达不做,让客户做 * 第4层:AI模型(GPT-4/Claude等) ← 英伟达支持,不直接做 * 第3层:AI框架(CUDA/Dynamo等) ← 英伟达垄断 * 第2层:AI集群(NVLink/InfiniBand) ← 英伟达垄断 * 第1层:AI芯片(GPU/LPU/网络芯片) ← 英伟达垄断 * 第0层:能源(电力/散热/土地) ← 留给NCP和本地企业 Nebius: 原Yandex分拆的欧洲AI云厂商。英伟达20亿美元投资是地缘政治驱动的战略卡位——扶持非美系、非大厂系的独立AI云,构建全球"主权AI"算力联盟,同时锁定欧洲市场对抗AWS/Google。这是黄仁勋"AI工厂设备商"定位的又一落地,也验证了MoE时代分布式算力需求的爆发。
是sia不咯
2个月前 广东
28
一些词语/背景解释,边听边查kimi记录的。适合像我这样的普通听众,没听明白的时候看: 奇点: 它指的是一个技术临界点——当人工智能的智能水平达到并超越人类智能时,技术进步将呈指数级爆炸式增长,人类社会将发生根本性变革。最早由计算机科学家冯·诺伊曼提出,后经未来学家雷·库兹韦尔(Ray Kurzweil)发扬光大。 SRAM: Static Random Access Memory,静态随机存取存储器。 为什么Groq用SRAM做AI推理? Groq 是一家做AI推理芯片的独角兽,他们的核心设计就是:用大量SRAM替代HBM(高带宽内存),其路线是"用钞能力换速度"——SRAM贵,但延迟极低。如果NVIDIA能把这种思路融合进GPU,就能兼顾通用性和推理速度。 DRAM: Dynamic Random-Access Memory,动态随机存取存储器。 LPU: Language Processing Unit(语言处理单元)。这是Groq专门为大模型推理设计的专用芯片。专为大模型对话推理设计的"加速器"。 * 特点:用的sram, IO存储高,吞吐率高,同时价格也很高。 * 特定场景:极高吞吐,极强稳定性,且贵。如ai coding。 长程任务: Long-horizon tasks,指需多步骤、长时间、持续执行的复杂任务。非常典型的给agent这一类的场景,做长时间任务模拟。 如:openclaw小龙虾;athropic的coworkers,自动接管你的桌面,做很多任务的整理,帮你处理excel的报表。(引发saas软件末日论) NCP: 英伟达合作伙伴,NVIDIA Cloud Partner。 星际之门铁三角的循环投资: OpenAI、英伟达、oracle。英伟达投openAI做 模型,甲骨文提供云计算,买英伟达芯片。(62期年终总结提到过) 英伟达的五层蛋糕: * 第5层:AI应用(ChatGPT/Cursor等) ← 英伟达不做,让客户做 * 第4层:AI模型(GPT-4/Claude等) ← 英伟达支持,不直接做 * 第3层:AI框架(CUDA/Dynamo等) ← 英伟达垄断 * 第2层:AI集群(NVLink/InfiniBand) ← 英伟达垄断 * 第1层:AI芯片(GPU/LPU/网络芯片) ← 英伟达垄断 * 第0层:能源(电力/散热/土地) ← 留给NCP和本地企业 Nebius: 原Yandex分拆的欧洲AI云厂商。英伟达20亿美元投资是地缘政治驱动的战略卡位——扶持非美系、非大厂系的独立AI云,构建全球"主权AI"算力联盟,同时锁定欧洲市场对抗AWS/Google。这是黄仁勋"AI工厂设备商"定位的又一落地,也验证了MoE时代分布式算力需求的爆发。
是sia不咯
2个月前 广东
26
一些词语/背景解释,边听边查kimi记录的。适合像我这样的普通听众,没听明白的时候看: 奇点: 它指的是一个技术临界点——当人工智能的智能水平达到并超越人类智能时,技术进步将呈指数级爆炸式增长,人类社会将发生根本性变革。最早由计算机科学家冯·诺伊曼提出,后经未来学家雷·库兹韦尔(Ray Kurzweil)发扬光大。 SRAM: Static Random Access Memory,静态随机存取存储器。 为什么Groq用SRAM做AI推理? Groq 是一家做AI推理芯片的独角兽,他们的核心设计就是:用大量SRAM替代HBM(高带宽内存),其路线是"用钞能力换速度"——SRAM贵,但延迟极低。如果NVIDIA能把这种思路融合进GPU,就能兼顾通用性和推理速度。 DRAM: Dynamic Random-Access Memory,动态随机存取存储器。 LPU: Language Processing Unit(语言处理单元)。这是Groq专门为大模型推理设计的专用芯片。专为大模型对话推理设计的"加速器"。 * 特点:用的sram, IO存储高,吞吐率高,同时价格也很高。 * 特定场景:极高吞吐,极强稳定性,且贵。如ai coding。 长程任务: Long-horizon tasks,指需多步骤、长时间、持续执行的复杂任务。非常典型的给agent这一类的场景,做长时间任务模拟。 如:openclaw小龙虾;athropic的coworkers,自动接管你的桌面,做很多任务的整理,帮你处理excel的报表。(引发saas软件末日论) NCP: 英伟达合作伙伴,NVIDIA Cloud Partner。 星际之门铁三角的循环投资: OpenAI、英伟达、oracle。英伟达投openAI做 模型,甲骨文提供云计算,买英伟达芯片。(62期年终总结提到过) 英伟达的五层蛋糕: * 第5层:AI应用(ChatGPT/Cursor等) ← 英伟达不做,让客户做 * 第4层:AI模型(GPT-4/Claude等) ← 英伟达支持,不直接做 * 第3层:AI框架(CUDA/Dynamo等) ← 英伟达垄断 * 第2层:AI集群(NVLink/InfiniBand) ← 英伟达垄断 * 第1层:AI芯片(GPU/LPU/网络芯片) ← 英伟达垄断 * 第0层:能源(电力/散热/土地) ← 留给NCP和本地企业 Nebius: 原Yandex分拆的欧洲AI云厂商。英伟达20亿美元投资是地缘政治驱动的战略卡位——扶持非美系、非大厂系的独立AI云,构建全球"主权AI"算力联盟,同时锁定欧洲市场对抗AWS/Google。这是黄仁勋"AI工厂设备商"定位的又一落地,也验证了MoE时代分布式算力需求的爆发。
vvvvve
2个月前 德国
16
太牛了,今天的嘉宾很硬核,给了很多内部观点,可能小白不那么友好但对行内人来说绝对信息量满满,谢谢诗婕和嘉宾
vvvvve
2个月前 德国
16
太牛了,今天的嘉宾很硬核,给了很多内部观点,可能小白不那么友好但对行内人来说绝对信息量满满,谢谢诗婕和嘉宾
vvvvve
2个月前 德国
15
太牛了,今天的嘉宾很硬核,给了很多内部观点,可能小白不那么友好但对行内人来说绝对信息量满满,谢谢诗婕和嘉宾
卫诗婕_漫谈LTS
2个月前 广西
10
嘉宾福利:置顶评论位帮招聘🌟 AI已进入Agent时代。PPIO正努力打造全球最高效的Token工厂与Agent沙盒。寻找死磕GPU极限的算子/推理系统专家,及精通微虚拟机、容器网络、大模型API路由的Infra极客。别再修补旧系统,加入我们,打穿算力成本,为下一代智能经济建造基础设施!欢迎投递简历至[email protected] 行云集成电路:重塑计算机形态,推动AI普惠。急寻推理框架开发、cuda算子、编译器大牛,加入我们,共筑AGI基石!欢迎投递简历至[email protected]
卫诗婕_漫谈LTS
2个月前 广西
10
嘉宾福利:置顶评论位帮招聘🌟 AI已进入Agent时代。PPIO正努力打造全球最高效的Token工厂与Agent沙盒。寻找死磕GPU极限的算子/推理系统专家,及精通微虚拟机、容器网络、大模型API路由的Infra极客。别再修补旧系统,加入我们,打穿算力成本,为下一代智能经济建造基础设施!欢迎投递简历至[email protected] 行云集成电路:重塑计算机形态,推动AI普惠。急寻推理框架开发、cuda算子、编译器大牛,加入我们,共筑AGI基石!欢迎投递简历至[email protected]
卫诗婕_漫谈LTS
2个月前 广西
10
嘉宾福利:置顶评论位帮招聘🌟 AI已进入Agent时代。PPIO正努力打造全球最高效的Token工厂与Agent沙盒。寻找死磕GPU极限的算子/推理系统专家,及精通微虚拟机、容器网络、大模型API路由的Infra极客。别再修补旧系统,加入我们,打穿算力成本,为下一代智能经济建造基础设施!欢迎投递简历至[email protected] 行云集成电路:重塑计算机形态,推动AI普惠。急寻推理框架开发、cuda算子、编译器大牛,加入我们,共筑AGI基石!欢迎投递简历至[email protected]
庄明浩
2个月前 上海
6
你这长度可以分两期发啊 亲
庄明浩
2个月前 上海
6
你这长度可以分两期发啊 亲
庄明浩
2个月前 上海
6
你这长度可以分两期发啊 亲
dong6
2个月前 浙江
5
前半场通俗易懂深入浅出,后半场昏昏欲睡
dong6
2个月前 浙江
5
前半场通俗易懂深入浅出,后半场昏昏欲睡
dong6
2个月前 浙江
4
前半场通俗易懂深入浅出,后半场昏昏欲睡
小三影子
2个月前 浙江
3
能听专业的人讲专业的事,真的很难得,也很荣幸。虽然有些听不懂,但还是收获了很多,感谢主播做了一期这么好的节目
小三影子
2个月前 浙江
3
能听专业的人讲专业的事,真的很难得,也很荣幸。虽然有些听不懂,但还是收获了很多,感谢主播做了一期这么好的节目
小三影子
2个月前 浙江
3
能听专业的人讲专业的事,真的很难得,也很荣幸。虽然有些听不懂,但还是收获了很多,感谢主播做了一期这么好的节目
HD613174x
2个月前 安徽
2
黑白,半张脸,新头像不是很好看。。
Tuffy
2个月前 广东
2
听第三遍了,每次听都有新知识!感恩美女主播和嘉宾~
小虾6688
2个月前 北京
2
其实我觉得未来AI算力不是一般人烧得起的,OPC的愿景很美好,但最后受益的还是金字塔顶的人,人类社会不管玩什么花活,底层逻辑是变不了的
楠_T8KE
2个月前 上海
2
作为一个文艺从业者路过来了解这个完全陌生,但因权益侵占问题(盗用声音,盗用作品等)产生了剧烈交集的行业,主播们见解很专业。想请问主播对于技术进步过程中对人权益的侵占是怎么看待的呢?
HD613174x
2个月前 安徽
2
黑白,半张脸,新头像不是很好看。。
Tuffy
2个月前 广东
2
听第三遍了,每次听都有新知识!感恩美女主播和嘉宾~
小虾6688
2个月前 北京
2
其实我觉得未来AI算力不是一般人烧得起的,OPC的愿景很美好,但最后受益的还是金字塔顶的人,人类社会不管玩什么花活,底层逻辑是变不了的
楠_T8KE
2个月前 上海
2
作为一个文艺从业者路过来了解这个完全陌生,但因权益侵占问题(盗用声音,盗用作品等)产生了剧烈交集的行业,主播们见解很专业。想请问主播对于技术进步过程中对人权益的侵占是怎么看待的呢?
HD613174x
2个月前 安徽
2
黑白,半张脸,新头像不是很好看。。
Tuffy
2个月前 广东
2
听第三遍了,每次听都有新知识!感恩美女主播和嘉宾~
小虾6688
2个月前 北京
2
其实我觉得未来AI算力不是一般人烧得起的,OPC的愿景很美好,但最后受益的还是金字塔顶的人,人类社会不管玩什么花活,底层逻辑是变不了的
Voilalala
2个月前 浙江
1
这期嘉宾很赞👍🏻
殿宇
2个月前 北京
1
这种有深度的内容,太好了
又爱玩又爱躺
1个月前 美国
1
1:38:55 太干货了!!把算力和带宽讲得很清楚。感谢博主,宝藏栏目马上关注了。很喜欢这期的嘉宾,特别透明地分享。
Voilalala
2个月前 浙江
1
这期嘉宾很赞👍🏻
殿宇
2个月前 北京
1
这种有深度的内容,太好了
又爱玩又爱躺
1个月前 美国
1
1:38:55 太干货了!!把算力和带宽讲得很清楚。感谢博主,宝藏栏目马上关注了。很喜欢这期的嘉宾,特别透明地分享。
楠_T8KE
2个月前 上海
1
作为一个文艺从业者路过来了解这个完全陌生,但因权益侵占问题(盗用声音,盗用作品等)产生了剧烈交集的行业,主播们见解很专业。想请问主播对于技术进步过程中对人权益的侵占是怎么看待的呢?
Voilalala
2个月前 浙江
1
这期嘉宾很赞👍🏻
殿宇
2个月前 北京
1
这种有深度的内容,太好了
迷失的贵族
2个月前 北京
0
听下来就一个感受:空头们 投降吧!唱衰掩饰不了你们踏空一年一年又一年的尴尬
金林慧鸽
2个月前 北京
0
1:54:27 主持人的洞见很敏锐啊,Nv肯定在布局个人消费级
小白的蜗牛
2个月前 江苏
0
干货满满,还在等67,68,69……
Ethbm
1个月前 重庆
0
对于一个前两天才知道token是什么的我来说,这期只能说是听完了,有点像过眼云烟。
yank1k0
1个月前 天津
0
Voilalala
1个月前 浙江
0
第二位嘉宾说话喜欢绕圈子,搞不明白为啥诗婕问的问题他老是没有办法正面或者至少精简地去回答。而且明明能用简单的逻辑解释的硬要堆术语,实在不大适合一档商业播客
卡卡在思考
2个月前 北京
0
1:52:21 不太认可每个人都买自己的设备运行模型,就像现在不会每个人都买一个发电设备一样
迷失的贵族
2个月前 北京
0
听下来就一个感受:空头们 投降吧!唱衰掩饰不了你们踏空一年一年又一年的尴尬
金林慧鸽
2个月前 北京
0
1:54:27 主持人的洞见很敏锐啊,Nv肯定在布局个人消费级
小白的蜗牛
2个月前 江苏
0
干货满满,还在等67,68,69……
Ethbm
1个月前 重庆
0
对于一个前两天才知道token是什么的我来说,这期只能说是听完了,有点像过眼云烟。
yank1k0
1个月前 天津
0
Voilalala
1个月前 浙江
0
第二位嘉宾说话喜欢绕圈子,搞不明白为啥诗婕问的问题他老是没有办法正面或者至少精简地去回答。而且明明能用简单的逻辑解释的硬要堆术语,实在不大适合一档商业播客
卡卡在思考
2个月前 北京
0
1:52:21 不太认可每个人都买自己的设备运行模型,就像现在不会每个人都买一个发电设备一样
yank1k0
1个月前 天津
0
栗子壳壳儿
2个月前 广东
0
把英伟达的野心和行业的现实扒得透透的,听着太过瘾!
迷失的贵族
2个月前 北京
0
听下来就一个感受:空头们 投降吧!唱衰掩饰不了你们踏空一年一年又一年的尴尬
金林慧鸽
2个月前 北京
0
1:54:27 主持人的洞见很敏锐啊,Nv肯定在布局个人消费级
卡卡在思考
2个月前 北京
0
1:52:21 不太认可每个人都买自己的设备运行模型,就像现在不会每个人都买一个发电设备一样
被小白牵着散步的蜗牛
2个月前 江苏
0
干货满满,还在等67,68,69……
Ethbm目前无事版
1个月前 重庆
0
对于一个前两天才知道token是什么的我来说,这期只能说是听完了,有点像过眼云烟。
Voilalala
1个月前 浙江
0
第二位嘉宾说话喜欢绕圈子,搞不明白为啥诗婕问的问题他老是没有办法正面或者至少精简地去回答。而且明明能用简单的逻辑解释的硬要堆术语,实在不大适合一档商业播客

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧