Album
时长:
10分钟
播放:
89
发布:
5天前
主播...
简介...
https://xiaoyuzhoufm.com
本期的 13 篇论文如下:
[00:24] 🧹 DoPE: Denoising Rotary Position Embedding(DoPE:面向旋转位置嵌入的去噪处理)
[00:58] 🧪 AIonopedia: an LLM agent orchestrating multimodal learning for ionic liquid discovery(AIonopedia:面向离子液体发现的LLM智能体多模态学习编排)
[01:44] 🖼 UI2Code^N: A Visual Language Model for Test-Time Scalable Interactive UI-to-Code Generation(UI2Code^N:面向测试时可扩展交互式UI转代码生成的视觉语言模型)
[02:20] 🚀 Virtual Width Networks(虚拟宽度网络)
[02:56] ⚡ LiteAttention: A Temporal Sparse Attention for Diffusion Transformers(LiteAttention:面向扩散Transformer的时序稀疏注意力机制)
[03:32] 🌐 Simulating the Visual World with Artificial Intelligence: A Roadmap(用人工智能模拟视觉世界:路线图)
[04:12] 📐 GGBench: A Geometric Generative Reasoning Benchmark for Unified Multimodal Models(GGBench:面向统一多模态模型的几何生成推理基准)
[05:00] 🧏 HI-TransPA: Hearing Impairments Translation Personal Assistant(HI-TransPA:面向听障者的语音-唇形翻译个人助手)
[05:35] 🚀 MarsRL: Advancing Multi-Agent Reasoning System via Reinforcement Learning with Agentic Pipeline Parallelism(MarsRL:基于智能体流水线并行强化学习的多智能体推理系统进阶研究)
[06:38] 🎭 EmoVid: A Multimodal Emotion Video Dataset for Emotion-Centric Video Understanding and Generation(EmoVid:面向情感中心视频理解与生成的大规模多模态情感视频数据集)
[07:18] 🧭 SpatialThinker: Reinforcing 3D Reasoning in Multimodal LLMs via Spatial Rewards(SpatialThinker:用空间奖励强化多模态大模型的3D推理)
[07:55] 📊 Workload Schedulers -- Genesis, Algorithms and Differences(工作负载调度器——起源、算法与差异)
[08:51] 🚗 CATS-V2V: A Real-World Vehicle-to-Vehicle Cooperative Perception Dataset with Complex Adverse Traffic Scenarios(CATS-V2V:面向复杂恶劣交通场景的真实车车协同感知数据集)
【关注我们】
您还可以在以下平台找到我们,获得播客内容以外更多信息
小红书: AI速递
评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧