大家好,欢迎收听'Hugging Face 每日AI论文速递'。今天是2024年7月29日,我们将带您快速浏览六篇热门AI论文,涵盖交互编码代理基准测试、单张图像物体重建、视频字幕生成等多个前沿领域。现在,让我们立即进入精彩的论文世界。

[00:25] 🌐 AppWorld: A Controllable World of Apps and People for Benchmarking Interactive Coding Agents(AppWorld:用于基准测试交互编码代理的应用程序和人为环境)
[01:08] 🌍 Floating No More: Object-Ground Reconstruction from a Single Image(不再悬浮:单张图像中的物体-地面重建)
[01:50] 📹 Wolf: Captioning Everything with a World Summarization Framework(Wolf:使用世界总结框架进行视频字幕生成)
[02:31] 🌐 VSSD: Vision Mamba with Non-Casual State Space Duality(VSSD:视觉Mamba与非因果状态空间对偶性)
[03:11] 🤖 SHIC: Shape-Image Correspondences with no Keypoint Supervision(SHIC:无需关键点监督的形状-图像对应关系)
[03:50] 📝 Lessons from Learning to Spin "Pens"(从学习旋转“笔”中得到的启示)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递

空空如也
暂无小宇宙热门评论