Taalas暴力芯片HC1 | 五十倍推理速度 | Llama 3.1 8B
AI前沿

Taalas暴力芯片HC1 | 五十倍推理速度 | Llama 3.1 8B

18分钟 224 1周前
节目简介
来源:小宇宙
如果AI推理的速度提升50倍,而成本和功耗却能缩减两个数量级,你会为了极致的性能放弃灵活性吗?本期带你直击芯片界的一颗深水炸弹,Taalas HC1。看这家由AMD核心设计总监组成的梦之队,如何通过将模型硬编码进硅片的暴力美学,彻底拆掉困扰行业多年的内存墙。我们不仅要实测每秒一万七千个 Token 的即时响应速度,更要深挖芯片即模型背后隐藏的技术局限与商业博弈。当英伟达还在死磕通用算力,Taalas 已经潜入极度专用化的角落,这究竟是算力的未来,还是注定过时的冒险?
聊天讨论群,可加微信gxjdian入群,需备注,来自播客AI前沿
评价

空空如也

小宇宙热评

暂无小宇宙热门评论

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧