大家好,欢迎收听“Hugging Face 每日AI论文速递”月末特辑。每个月的最后一天,我们都会为您带来当月Hugging Face上最热门的AI论文汇总。今天,我们将带您回顾2024年8月的精彩研究成果。

本期节目涵盖了从文本生成模型的交互式学习、长上下文检索的新推理模式,到实时游戏引擎中的扩散模型应用,以及图像与视频中的任意分割技术等多个前沿领域。此外,我们还将探讨AI在科学发现自动化、多模态大型语言模型的视觉表示等方面的最新进展。
现在,让我们一起深入这些令人兴奋的AI研究,探索科技的未来。节目马上开始,敬请期待!
[00:47] TOP1(🔥148) | 🔍 Transformer Explainer: Interactive Learning of Text-Generative Models(Transformer解释器:交互式学习文本生成模型)
[02:54] TOP2(🔥130) | 📚 Writing in the Margins: Better Inference Pattern for Long Context Retrieval(边缘写作:长上下文检索的更好推理模式)
[04:59] TOP3(🔥108) | 🎮 Diffusion Models Are Real-Time Game Engines(扩散模型作为实时游戏引擎)
[06:58] TOP4(🔥100) | 🎥 SAM 2: Segment Anything in Images and Videos(SAM 2:图像与视频中的任意分割)
[08:50] TOP5(🔥100) | 🤖 The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery(AI科学家:迈向完全自动化的开放式科学发现)
[10:26] TOP6(🔥99) | 🦙 The Llama 3 Herd of Models(Llama 3 模型群)
[12:37] TOP7(🔥97) | 🔍 Building and better understanding vision-language models: insights and future directions(构建和更好地理解视觉-语言模型:见解与未来方向)
[15:10] TOP8(🔥95) | 🤖 xGen-MM (BLIP-3): A Family of Open Large Multimodal Models(xGen-MM (BLIP-3): 开放大型多模态模型系列)
[17:05] TOP9(🔥84) | 📊 GMAI-MMBench: A Comprehensive Multimodal Evaluation Benchmark Towards General Medical AI(GMAI-MMBench:面向通用医疗AI的综合多模态评估基准)
[19:24] TOP10(🔥81) | 🔍 Law of Vision Representation in MLLMs(多模态大型语言模型中的视觉表示定律)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递

空空如也
暂无小宇宙热门评论