https://babi.com/

slot gacor

HuggingFace 每日AI论文速递 - 2026.02.03 | 分阶段训练统一动作空间;MoE+视觉编码器并行智能体 - EarsOnMe - 精选播客,一听即合
Album
时长:
13分钟
播放:
68
发布:
1天前
主播...
简介...
https://xiaoyuzhoufm.com
【赞助商】
通勤路上就听AI每周谈。AI每周谈,每周带你回顾上周AI大事
传送门 🔗https://www.xiaoyuzhoufm.com/podcast/688a34636f5a275f1cba40fd
【目录】
本期的 15 篇论文如下:
[00:32] 🤖 Green-VLA: Staged Vision-Language-Action Model for Generalist Robots(Green-VLA:面向通用机器人的分阶段视觉-语言-动作模型)
[01:24] 🤖 Kimi K2.5: Visual Agentic Intelligence(Kimi K2.5:视觉智能体)
[02:09] 🔍 Vision-DeepResearch: Incentivizing DeepResearch Capability in Multimodal Large Language Models(Vision-DeepResearch:激励多模态大语言模型中的深度研究能力)
[03:08] 🔍 Vision-DeepResearch Benchmark: Rethinking Visual and Textual Search for Multimodal Large Language Models(Vision-DeepResearch 基准:重新思考多模态大语言模型的视觉与文本搜索)
[03:57] 🔄 Closing the Loop: Universal Repository Representation with RPG-Encoder(闭环:基于RPG-Encoder的通用代码仓库表示方法)
[04:39] 🧠 UniReason 1.0: A Unified Reasoning Framework for World Knowledge Aligned Image Generation and Editing(UniReason 1.0:面向世界知识对齐图像生成与编辑的统一推理框架)
[05:23] 📊 WildGraphBench: Benchmarking GraphRAG with Wild-Source Corpora(WildGraphBench:基于野生来源语料库的图检索增强生成基准测试)
[06:28] 📚 FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents(FS-Researcher:基于文件系统的智能体在长周期研究任务中的测试时扩展)
[07:23] 🚀 SWE-Universe: Scale Real-World Verifiable Environments to Millions(SWE-Universe:将真实世界可验证的软件工程环境扩展至百万规模)
[08:13] 📚 Wiki Live Challenge: Challenging Deep Research Agents with Expert-Level Wikipedia Articles(维基实时挑战:用专家级维基百科文章挑战深度研究智能体)
[08:58] ⚖ SLIME: Stabilized Likelihood Implicit Margin Enforcement for Preference Optimization(SLIME:基于稳定似然的隐式边界强化偏好优化)
[09:45] 🎨 PixelGen: Pixel Diffusion Beats Latent Diffusion with Perceptual Loss(PixelGen:基于感知损失的像素扩散模型超越潜在扩散模型)
[10:38] ⚙ RLAnything: Forge Environment, Policy, and Reward Model in Completely Dynamic RL System(RLAnything:在完全动态强化学习系统中锻造环境、策略与奖励模型)
[11:30] 🧠 Mind-Brush: Integrating Agentic Cognitive Search and Reasoning into Image Generation(思维画笔:将智能认知搜索与推理融入图像生成)
[12:17] 🎬 PISCES: Annotation-free Text-to-Video Post-Training via Optimal Transport-Aligned Rewards(PISCES:基于最优传输对齐奖励的无标注文本到视频后训练方法)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧