AI智能总结...
AI/summary > _
在2025年NV... ...
System: 需要登录后查看完整内容
简介...
https://xiaoyuzhoufm.com
3月17日,全球科技界迎来 AI 领域的「超级碗」-- 英伟达 GTC 大会。英伟达 CEO 黄仁勋在 Keynotes 的演讲中揭晓了英伟达所布局的 AI 发展路线图:从生成式 AI 到代理式 AI(Agentic AI),最终迈向物理 AI(Physical AI)。一方面,英伟达发布了比如 Blackwell Ultra 等更快更强的硬件设备,另一方面,英伟达则致力于打造 AI 时代的「操作系统」,将开发者绑定在英伟达的 「AI 工厂」生态当中。老黄的演讲结束之后,英伟达股票先是下跌 3.4%,第二天又有所反弹,反应出资本市场情绪的改变。
「科技早知道」主播丁教 Diane 也是去了 GTC 大会现场,为大家带回了第一手的报道。我们今天的节目聚焦英伟达以「推理主战场」为核心的软件生态,为大家详细解析英伟达技术飞轮的各个环节 -- 从开源推理框架、到 GPU cloud,再到机器人模型。可以肯定的事,英伟达的野心已经不再是一家「卖卡」的硬件公司,而是将 AI 时代的软件平台牢牢掌握在自己手中。
本期人物
丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播
Yaxian,「科技早知道」节目监制
主要话题
[01:01] 英伟达股价先跌后涨,黄仁勋讲的不是「新故事」,但却是「新现实」
[03:55] 英伟达三大推理基础设施:Llama Nemotron 开源大模型,Dynamo 推理系统、AI 数据模型
[07:22] Dynamo 软件 :AI 厨房的中央调度系统,让推理更快更高效
[11:40] 原生 GPU cloud 服务商崛起:AI 时代云计算格局大洗牌
[15:16] 拼大模型训练的时代已经过去,为什么推理才是未来 AI 的主战场?
[20:46] Agentic AI 全面爆发,Physical AI 即将到来
[23:04] 机器人赛道突飞猛进:Cosmos 生成模拟数据,Issac GR00T N1 提供基础模型
[26:45] 自动驾驶技术的未来:Road AGI 指日可待
延伸信息
NIM
NVIDIA NIM 是 NVIDIA AI Enterprise 的一部分,为自托管 GPU 加速推理微服务提供容器,基于优化推理引擎构建,能自动优化模型和 GPU 组合的性能,还提供标准数据源和自动扩展支持。
Llama Nemotron
Llama Nemotron 是 NVIDIA 推出的开放式大语言模型系列,基于商用开源 Llama 基础模型构建。该系列为 AI 智能体开发提供优化基础模组,可通过 NVIDIA NIM 微服务等形式提供,能在多种计算平台上运行,为企业代理式 AI 奠定基础。
Dynamo
Dynamo 是 GTC 大会发布的开源推理软件,通过协调数千个 GPU 间的推理通信,降低成本、提高效率,集成了 GPU 规划器等四大创新组件,兼容多种主流推理后端。
Isaac GR00T N1
Isaac GR00T N1 是 NVIDIA 推出的全球首款开源人形机器人功能模型。它采用双系统架构,系统 1 基于扩散变换器,能实时生成精准连续动作轨迹,执行高频率操作;系统 2 基于视觉 - 语言模型,负责环境感知、任务推理与规划。
Cosmos
是英伟达的世界基础模型平台,包括 Cosmos Transfer 和 Cosmos Predict 等模型,可将 3D 仿真数据转换为逼真视频,用于生成合成数据,能加速机器人和自动驾驶领域的物理 AI 开发。
VLA 技术
是视觉 - 语言 - 动作模型(Vision - Language - Action Model)。它是一种融合了视觉、语言和动作的多模态大模型范式。它可以从传感器数据中提取丰富的环境信息,借助语言模型理解人类指令并生成可解释的决策过程,最后转化为驾驶操作指令。
内容研究志愿者招募
Hi 你好呀,这里是《科技早知道》内容研究志愿者招募。如果你是前沿科技行业的从业者(包括但不限于半导体、先进制造、计算机、AI、生物医药、航空航天等等),欢迎加入我们分享你在行业内的一手观察和见解。
你将有机会参与到节目的制作当中,你的知识和见解也可能成为未来节目的一部分!
志愿者招募入口
加入声动活泼
声动活泼目前开放全职设计师、商业发展经理、商业内容策划、内容编辑实习生、早咖啡内容研究实习生、社群运营实习生等6个职位,详情点击招聘入口
声动活泼年度新节目上线!
[Untitled]
这次,我们倾全团队之力为 AI 时代的青少年做了一件微小但重要的事。
每期 10 分钟,从一个青少年感兴趣的现象谈起,涉及商业科技、社会人文等话题,解读表象背后的深层逻辑,启发青少年提出自己的好奇。每周一、三、五早晨 6 点在各大音频平台准时更新。
🧧前 3 期内容可以免费试听。现在购买,即可享受早鸟价 292 元,2025 年 4 月 30 日之后,将恢复原价 365 元。现在就去节目主页试听吧 ↓
小宇宙听友请点这里
Apple Podcast 听友请点这里
幕后制作
监制:Yaxian
后期:Jack
运营:George
设计:饭团
商务合作
声动活泼商务合作咨询
[Untitled]
关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡、声东击西、吃喝玩乐了不起、反潮流俱乐部、泡腾 VC、商业WHY酱、跳进兔子洞 、不止金钱
欢迎在即刻、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:[email protected]
[声小音]
欢迎扫码添加声小音,在节目之外和我们保持联系。
Special Guest: 雅娴.
评价...

空空如也

小宇宙热门评论...
七个梦
4个月前 福建
5
03:18 前几天刚听完 https://www.xiaoyuzhoufm.com/episode/67db2aff78103db3bd993dbc
约小亚
4个月前 上海
4
的地得错误出现在标题里,运营同学扣鸡腿🐶
Ming_Stacey
4个月前 美国
3
期待科技早知道聊量子计算!
哄哄_Kfu9
4个月前 安徽
2
双方都知道对方要说什么,明知故问的对话形式很奇怪
Shawn998
4个月前 新加坡
1
00:06 来了来了
Ming_Stacey
4个月前 美国
1
来啦!之前是aws/gcp的gpu cloud + AI (sage maker/vertexAI),老黄这回是要基于自己的优势,把大家拉回Nvidia从硬件到软件的生态系统嘛🤣
陈乐群
4个月前 美国
1
12:41 不仅是需要GPU,还需要配套的网卡。众所周知,N卡网速快。这句话在 NVIDIA 收购了 Mellanox 之后就从梗变成了事实。Mellanox 的 ConnectX 网卡支持一个技术叫做 IBGDA,就是能让显卡直接向网卡发消息,不需要经过CPU。IBGDA 和 RDMA 不同,RDMA 只是数据传输不需要经过 CPU,而 IBGDA 甚至连发起传输这个操作都不需要经过 CPU。这个技术可以大幅度地降低延迟,对 DeepSeek 这样的 MoE 模型特别重要,因为生成一个token就需要进行116次跨机通讯。然而 AWS 的自研网卡现在还不支持这个功能。AWS P5和P5e实例搭配的 EFAv2 从硬件上就不支持这个功能。P5en 实例搭配的 EFAv3 倒是可以在硬件上增加这个支持,但是从安全审核到 BIOS 到驱动到上层的软件接口,全部都还是空白。
声动活泼的声小音
4个月前 北京
1
我们为 AI 时代的青少年打造的晨间新播客「Knock Knock 世界」已上线!欢迎 9 岁以上的青少年和家长们免费试听→ https://www.xiaoyuzhoufm.com/podcast/67ce9e52a97df5faf716bcc7
imakoala
4个月前 澳大利亚
0
盼来了🤩🤓🥸!
晓霞Shirley
4个月前 美国
0
cool!
沈沈要吃麦辣鸡翅
4个月前 江西
0
来啦!
神奇奕沛
4个月前 重庆
0
国内非常多的公司为了本地部署DeepSeekAI模型,英伟达特供国内的H20 GPU似乎已经爆单了,正好符合上期Yaxian说的某部分市场增长的情况。
cloudtoday
3个月前 上海
0
支持科技早知道
dadalada
3个月前 广东
0
“科技播客内容质量评价”访谈招募 👋你好! 我是一名在努力平衡理想和实践的大学生, 正处在迷茫探索的阶段, 特别感激您此时给予的信任和帮助🙏 我是谁?为什么要访谈? 我是华南理工大学新闻与传播学院广告学大四毕业生,已保研至西安交通大学网络与新媒体专业, 正在做科技传播和播客内容质量的研究, 致力于构建一套科技播客内容质量评价体系, 因此希望通过访谈了解大家对科技播客内容的看法 我想和你聊什么?怎么聊? 如果你经常收听科技播客(如小宇宙平台上的硅谷 101、科技早知道、科技乱炖、乱翻书等), 且对科技播客内容有自己的见解和建议, 希望能邀请你做一个三十分钟左右的访谈, 非常期待你的分享!(vx:CsusYtainXable) 有偿,提供一份奶茶或者甜品报销,如果日后有其他能帮上忙的也可以随时交流~
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧