2026.05.05 | 开源MolmoAct2实战87%成功率;GPT上下文提炼技能再升级
HuggingFace 每日AI论文速递

2026.05.05 | 开源MolmoAct2实战87%成功率;GPT上下文提炼技能再升级

11分钟 122 6天前
节目简介
来源:小宇宙
【目录】
本期的 14 篇论文如下:
[00:21] 🤖 MolmoAct2: Action Reasoning Models for Real-world Deployment(MolmoAct2:面向实际部署的動作推理模型)
[01:02] 🧠 From Context to Skills: Can Language Models Learn from Context Skillfully?(从上下文到技能:语言模型能否从上下文中巧妙学习?)
[01:44] 🔁 Repetition over Diversity: High-Signal Data Filtering for Sample-Efficient German Language Modeling(重复胜于多样:面向样本高效德语语言模型的高信号数据过滤)
[02:35] 👁 Persistent Visual Memory: Sustaining Perception for Deep Generation in LVLMs(持久视觉记忆:在大视觉语言模型中维持感知以支持深度生成)
[03:18] 🌊 OceanPile: A Large-Scale Multimodal Ocean Corpus for Foundation Models(海洋堆:面向基础模型的大规模多模态海洋语料库)
[03:56] 🧩 ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models(ComboStoc:扩散生成模型的组合随机性)
[04:44] 🎓 AcademiClaw: When Students Set Challenges for AI Agents(AcademiClaw:当学生为AI代理设置挑战时)
[05:25] 🏥 PhysicianBench: Evaluating LLM Agents in Real-World EHR Environments(医师基准:在真实电子健康记录环境中评估大语言模型智能体)
[06:06] 🤖 T$^2$PO: Uncertainty-Guided Exploration Control for Stable Multi-Turn Agentic Reinforcement Learning(T²PO:不确定性引导的探索控制实现稳定多轮智能体强化学习)
[07:04] 🌳 Hierarchical Abstract Tree for Cross-Document Retrieval-Augmented Generation(面向跨文档检索增强生成的分层抽象树)
[07:54] 🌌 Generative Modeling with Orbit-Space Particle Flow Matching(基于轨道空间粒子流匹配的生成式建模)
[08:30] 🧠 Perceptual Flow Network for Visually Grounded Reasoning(感知流网络用于视觉基础推理)
[09:06] 🎬 Motion-Aware Caching for Efficient Autoregressive Video Generation(运动感知缓存实现高效自回归视频生成)
[09:54] 🤖 Code World Model Preparedness Report(代码世界模型准备情况报告)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧