大家好,欢迎收听今天的'Hugging Face 每日AI论文速递'。今天是2024年9月5日,我们将带您快速浏览8篇热门AI论文。本期内容涵盖了多模态大语言模型的扩展、音频驱动的人像化身、长上下文问答中的引用生成、多学科多模态理解基准的提升,以及代码预训练中的数据解密等多个前沿领域。现在,让我们立即进入今天的论文速递。
[00:31] 📊 LongLLaVA: Scaling Multi-modal LLMs to 1000 Images Efficiently via Hybrid Architecture(LongLLaVA:通过混合架构高效扩展多模态大语言模型至1000张图像)
[01:13] 🎙 Loopy: Taming Audio-Driven Portrait Avatar with Long-Term Motion Dependency(Loopy: 驯服音频驱动的人像化身与长期运动依赖)
[01:48] 📚 LongCite: Enabling LLMs to Generate Fine-grained Citations in Long-context QA(LongCite: 在长上下文问答中使LLMs生成细粒度引用的方法)
[02:29] 📊 MMMU-Pro: A More Robust Multi-discipline Multimodal Understanding Benchmark(MMMU-Pro:一个更强大的多学科多模态理解基准)
[03:02] 🧩 Arctic-SnowCoder: Demystifying High-Quality Data in Code Pretraining(北极雪编码器:解密代码预训练中的高质量数据)
[03:39] 🗳 Political DEBATE: Efficient Zero-shot and Few-shot Classifiers for Political Text(政治辩论:高效的零样本和少样本政治文本分类器)
[04:15] ⚡ FastVoiceGrad: One-step Diffusion-Based Voice Conversion with Adversarial Conditional Diffusion Distillation(FastVoiceGrad:一步扩散基于对抗条件扩散蒸馏的语音转换)
[04:48] 🤖 Affordance-based Robot Manipulation with Flow Matching(基于流匹配的机器人操作框架)

【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递

空空如也
暂无小宇宙热门评论