9月9日的 AI 基础设施峰会上,英伟达宣布推出一款名为 Rubin CPX的新 GPU,号称专门为超过 100 万 token 的长上下文推理而设计。第二天,Semianalysis就发布了一篇专题报告,由迪伦·帕特尔(Dylan Patel)等7位行业分析师联合撰写,数据详实到甚至包含了机架的物料清单(BOM)和功率预算。今天我们就结合这篇报告,详细拆解一下Rubin CPX的技术价值和行业影响,看看为什么它被称为“AI推理基础设施的又一次巨大飞跃”。 https://semianalysis.com/2025/09/10/another-giant-leap-the-rubin-cpx-specialized-accelerator-rack/ 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
最近,斯坦福大学2025年春季的CS231N课程,开始了首次授课,主讲人是全球AI领域的顶尖学者、计算机视觉的奠基人之一,李飞飞(Fei-Fei Li)。这堂课程不仅串联了5.4亿年的视觉进化史,更是回答了深度学习革命中的一个核心逻辑,为什么说“看懂世界”,是AI真正走向智能的第一步?在这堂课上,李飞飞从寒武纪的三叶虫讲起,聊到达芬奇的暗箱实验,再到2012年的AlexNet,最后到生成式AI如何让机器“学会创造”,整个过程既有科学史的温度,也有技术细节的深度,相信会让你对AI视觉领域有一个全新的认知。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
9月11日当天,Thinking Machines Lab正式推出了他们的研究博客,名字叫Connectionism,翻译过来就是联结主义。而博客的第一篇文章,就直接瞄准了大模型推理中最让人头疼的“非确定性”问题,标题是《击败大语言模型推理中的非确定性》。这篇文章不仅点破了很多人对大模型非确定性的误解,还给出了可落地的解决方案,甚至附上了完整的实验数据,今天我们就从现象到原理,再到解决方案,对这篇论文进行一个解读。 https://thinkingmachines.ai/blog/defeating-nondeterminism-in-llm-inference/ 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
Claude Code是最好的AI编程工具么?可能有人并不同意。最近,Codex负责人亚历山大·恩比里科斯(Alexander Embiricos)在与a16z的一场深度访谈中,详细拆解了Codex的诞生过程和设计逻辑,从一开始,只是想让推理模型能够“像初级工程师一样改代码”,到在本地和云端的部署,反复迭代才最终形成了现在的Agent形态。今天我们就来通过这个访谈,聊聊Codex到底特殊在哪,以及它对整个软件工程行业的影响。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
来自OpenAI和佐治亚理工联合发表的论文《为什么语言模型会有幻觉(Why Language Models Hallucinate)》。这篇论文的价值在于,它没有把幻觉归咎于“模型不够大”、“训练数据不够多”这类表面的原因,而是用严谨的统计理论和实证案例证明,幻觉本质上是两个核心问题的产物,分别是预训练阶段的“统计误差传导”,以及后训练阶段的“评估机制激励错位”。换句话说,幻觉不是技术上的“意外”,而是现有训练和评估逻辑下的“必然结果”。今天我们就从这两个核心问题入手,一步步搞懂幻觉的来龙去脉,以及到底该怎么解决它。 cdn.openai.com 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
AI巨头天价赔偿!因使用盗版书训练模型,Anthropic将向作家支付15亿美元。这起创纪录的版权案,焦点不在于“训练”,而在于“来源”,或将重塑AI与创作的未来。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
上周,国际顶级芯片会议Hot Chips正式落下帷幕,作为芯片及系统设计领域的“年度风向标”,今年的大会没有让人失望,从能把AI超算塞进桌面的芯片,到用光线替代电线的互连技术,再到能扛住十亿瓦级数据中心的散热方案,每一个技术细节都在悄悄改写未来科技的底层逻辑。今天这一期,我会用近一小时的时间,逐领域的拆解本届Hot Chips的核心突破,把那些藏在技术文档里的参数、架构和创新,用更加通俗易懂的方式讲透,也让大家看清楚接下来1-2年芯片行业的真实走向。hotchips.org 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
如果你关注人工智能和计算机科学,那么对杰夫·迪恩(Jeff Dean)这个名字一定不会陌生。他不仅是谷歌早期的核心工程师之一,更是一手缔造了谷歌大脑这个举世瞩目的AI研究团队。他的职业生涯,犹如一场精彩的连续创业,不断投身于新的挑战,推动着技术边界的拓展。今天,我们将通过The Moonshot Factory的播客采访,深入来了解一下杰夫·迪恩的成长经历、他在谷歌大脑的早期探索,以及他对人工智能未来发展的深刻洞察。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
曾经,Anthropic在Claude刚上线的时候,明确说过“绝不使用用户数据来训练模型”,这也是很多用户选择Claude的重要原因,但是现在,他们不仅要让用户选择,是否同意将数据用于训练,还设置了一个月的“最后通牒”,甚至把同意数据训练后的保留期,延长到了5年。今天咱们就借着这件事,聊聊这次条款更新的细节,用户的真实反馈,以及整个AI行业的隐私困境。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
8月28日,红杉美国合伙人康斯坦丁·布勒 Konstantine Buhler ,发表了一场题为 《10万亿美元的人工智能革命(The $10 Trillion AI Revolution)》 的演讲。在这次演讲里,红杉给出了两个明确判断,第一,AI革命的演进速度远快于工业革命。第二,专业化将成为AI革命的核心逻辑。今天大飞就来给大家分享一下这个演讲的主要内容。 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
Meta在AI团队最近的磨合重组的过程中,至少有8名骨干员工,包括研究人员、工程师和高级产品负责人,相继离职,这里面不仅有刚加入没多久的新人,还有在Meta待了多年的老将。更让人意外的是,其中两名新员工在Meta工作了不到一个月,就选择重返OpenAI。今天这期节目,咱们就来详细聊聊这些离职的情况, 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
今天要给大家讲一个听起来几乎不可能完成的项目,三个月的时间,从零开始,居然真的有人做出了一块能运行的TPU,而且既能推理又能训练,关键是还开源了。听到这里你可能会觉得不可思议,毕竟TPU作为谷歌设计的专用AI芯片,从2015年部署到现在,已经迭代到了第七代,背后是顶尖的工程师团队和先进的制程工艺。但是来自加拿大西安大略大学的工程师们,用一个暑假的时间,完成了这个看似不可能的挑战,他们把这个项目叫做TinyTPU。 https://www.tinytpu.com/ https://github.com/tiny-tpu-v2/tiny-tpu/tree/main 聊天讨论群,微信群二维码,可加个人微信gxjdian入群
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧