Album
时长:
16分钟
播放:
211
发布:
1个月前
主播...
简介...
https://xiaoyuzhoufm.com

英伟达推出的Rubin CPX是专为AI推理预填充阶段优化的加速器。它侧重计算性能(20 PFLOPS FP8稠密计算能力)而非内存带宽,通过采用更经济且每GB成本可降低50%以上的GDDR7内存(128GB,2TB/s)替代昂贵的HBM。这使得Rubin CPX的生产成本仅为R200的四分之一,同时能提供R200 90%的计算能力,实现了卓越的单位成本浮点运算效率。


该解决方案部署于创新的Vera Rubin机架,采用“三明治”液冷、无缆化及模块化设计,大幅提升了密度和可维护性。Rubin CPX的发布是AI推理领域的“游戏规则改变者”,标志着解耦式服务新阶段的到来。它通过避免昂贵HBM在预填充阶段的资源浪费,显著降低了AI的总拥有成本(TCO),并能增加英伟达的利润。此举进一步拉大了英伟达与竞争对手(如AMD、Google TPU、AWS Trainium)的差距,并指引未来AI硬件向更专业化的方向发展。

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧