播客: HuggingFace 每日AI论文速递 - EarsOnMe

播客简介...

每天10分钟，带您快速了解当日HuggingFace热门AI论文内容。每个工作日更新，欢迎订阅。 📢播客节目在小宇宙、Apple Podcast平台搜索【HuggingFace 每日AI论文速递】 🖼另外还有图文版，可在小红书搜索并关注【AI速递】

HuggingFace 每日AI论文速递的创作者...

拨号上网

HuggingFace 每日AI论文速递的节目...

2025.09.08 | 语言模型幻觉源于预训练；大模型图形编程性能提升

HuggingFace 每日AI论文速递

本期的 12 篇论文如下： [00:24] 🤔 Why Language Models Hallucinate（语言模型为何产生幻觉） [00:47] 🎨 Symbolic Graphics Programming with Large Language Models（使用大型语言模型进行符号化图形编程） [01:17] ⚡ Set Block Decoding is a Language Model Inference Accelerator（集合块解码：一种语言模型推理加速器） [01:43] 🎼 WildScore: Benchmarking MLLMs in-the-Wild Symbolic Music Reasoning（WildScore：多模态大语言模型在真实场景下的符号音乐推理基准测试） [02:14] 🌍 LatticeWorld: A Multimodal Large Language Model-Empowered Framework for Interactive Complex World Generation（LatticeWorld：基于多模态大语言模型的交互式复杂世界生成框架） [02:42] 💡 LuxDiT: Lighting Estimation with Video Diffusion Transformer（LuxDiT：基于视频扩散变换器的光照估计） [03:15] 📷 WinT3R: Window-Based Streaming Reconstruction with Camera Token Pool（WinT3R：基于窗口流式重建与相机令牌池） [03:44] 📉 On Robustness and Reliability of Benchmark-Based Evaluation of LLMs（基于基准测试的LLM评估的鲁棒性与可靠性研究） [04:07] 🔍 MedVista3D: Vision-Language Modeling for Reducing Diagnostic Errors in 3D CT Disease Detection, Understanding and Reporting（MedVista3D：用于减少3D CT疾病检测、理解和报告中诊断错误的视觉语言建模） [04:43] 🦾 U-ARM : Ultra low-cost general teleoperation interface for robot manipulation（U-ARM：用于机器人操作的超低成本通用遥操作接口） [05:16] 🔍 Behavioral Fingerprinting of Large Language Models（大型语言模型的行为指纹识别） [05:45] 🚀 Bootstrapping Task Spaces for Self-Improvement（自改进任务空间的引导构建）【关注我们】您还可以在以下平台找到我们，获得播客内容以外更多信息小红书: AI速递

6分钟

85

1天前

【周末特辑】9月第2周最火AI论文 | LLM智能体RL综述；AI代码安全基准

HuggingFace 每日AI论文速递

本期的 5 篇论文如下： [00:35] TOP1(🔥139) | 🤖 The Landscape of Agentic Reinforcement Learning for LLMs: A Survey（面向大语言模型的智能体强化学习全景：一项综述） [01:52] TOP2(🔥133) | 🔒 A.S.E: A Repository-Level Benchmark for Evaluating Security in AI-Generated Code（A.S.E：一个用于评估AI生成代码安全的仓库级基准） [02:57] TOP3(🔥127) | 🤖 A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers（科学大型语言模型综述：从数据基础到智能体前沿） [04:15] TOP4(🔥103) | 🧠 R-4B: Incentivizing General-Purpose Auto-Thinking Capability in MLLMs via Bi-Mode Annealing and Reinforce Learning（R-4B: 通过双模式退火和强化学习激励多模态大语言模型的通用自动思考能力） [05:11] TOP5(🔥101) | 🤔 Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth（废话学：用深度解读无意义内容挑战大型语言模型）【关注我们】您还可以在以下平台找到我们，获得播客内容以外更多信息小红书: AI速递

7分钟

99+

3天前

2025.09.05 | 大型语言模型语义理解弱；图像编辑模型提升几何估计

HuggingFace 每日AI论文速递

本期的 13 篇论文如下： [00:22] 🤔 Drivel-ology: Challenging LLMs with Interpreting Nonsense with Depth（废话学：用深度解读无意义内容挑战大型语言模型） [00:47] 📐 From Editor to Dense Geometry Estimator（从编辑模型到密集几何估计器） [01:08] 🧠 Towards a Unified View of Large Language Model Post-Training（迈向大语言模型后训练的统一视角） [01:39] 🔄 Inverse IFEval: Can LLMs Unlearn Stubborn Training Conventions to Follow Real Instructions?（逆向IFEval：大型语言模型能否摒弃顽固训练惯例以遵循真实指令？） [02:05] 🔬 DeepResearch Arena: The First Exam of LLMs' Research Abilities via Seminar-Grounded Tasks（深度研究竞技场：基于研讨会任务对大语言模型研究能力的首次考核） [02:26] 🚀 Transition Models: Rethinking the Generative Learning Objective（过渡模型：重新思考生成式学习目标） [02:54] 🔍 NER Retriever: Zero-Shot Named Entity Retrieval with Type-Aware Embeddings（NER检索器：基于类型感知嵌入的零样本命名实体检索） [03:24] ⚡ Few-step Flow for 3D Generation via Marginal-Data Transport Distillation（基于边缘数据传输蒸馏的少步流3D生成方法） [03:53] 🎬 Video-MTR: Reinforced Multi-Turn Reasoning for Long Video Understanding（视频多轮推理：面向长视频理解的强化多轮推理框架） [04:19] 🎭 Durian: Dual Reference-guided Portrait Animation with Attribute Transfer（Durian：基于双参考引导的肖像动画与属性迁移） [04:47] 📐 Drawing2CAD: Sequence-to-Sequence Learning for CAD Generation from Vector Drawings（Drawing2CAD：基于序列到序列学习的矢量绘图CAD生成） [05:24] 🧠 Delta Activations: A Representation for Finetuned Large Language Models（Delta激活：微调大型语言模型的一种表示方法） [06:01] ⚠ False Sense of Security: Why Probing-based Malicious Input Detection Fails to Generalize（虚假安全感：为何基于探测的恶意输入检测方法难以泛化）【关注我们】您还可以在以下平台找到我们，获得播客内容以外更多信息小红书: AI速递

6分钟

86

4天前

2025.09.04 | 机器人任务规划高效；数据推理能力提升

HuggingFace 每日AI论文速递

本期的 5 篇论文如下： [00:24] 🤖 Robix: A Unified Model for Robot Interaction, Reasoning and Planning（Robix：一个用于机器人交互、推理和规划的统一模型） [00:54] 🔍 Open Data Synthesis For Deep Research（面向深度研究的开放数据合成） [01:30] 🧠 LMEnt: A Suite for Analyzing Knowledge in Language Models from Pretraining Data to Representations（LMEnt：一套分析语言模型从预训练数据到表示的知识套件） [02:00] 🧩 MOSAIC: Multi-Subject Personalized Generation via Correspondence-Aware Alignment and Disentanglement（MOSAIC: 基于对应感知对齐和解纠缠的多主体个性化生成） [02:32] 🧠 Planning with Reasoning using Vision Language World Model（基于视觉语言世界模型的规划与推理）【关注我们】您还可以在以下平台找到我们，获得播客内容以外更多信息小红书: AI速递

4分钟

90

5天前

> 全部节目

喜欢听HuggingFace 每日AI论文速递的人也喜欢的播客...