Album
时长:
6分钟
播放:
130
发布:
4个月前
主播...
简介...
https://xiaoyuzhoufm.com

本期的 9 篇论文如下:


[00:21] 🎬 Kwai Keye-VL Technical Report(Kwai Keye-VL 技术报告)


[01:02] 🎨 LongAnimation: Long Animation Generation with Dynamic Global-Local Memory(LongAnimation:基于动态全局-局部记忆的长期动画生成)


[01:50] 👁 Depth Anything at Any Condition(任意条件下的深度感知)


[02:28] 🤖 A Survey on Vision-Language-Action Models: An Action Tokenization Perspective(视觉-语言-动作模型综述:一种动作Token化的视角)


[03:11] 🪄 FreeMorph: Tuning-Free Generalized Image Morphing with Diffusion Model(FreeMorph:基于扩散模型的免调参通用图像渐变)


[03:51] 🖼 Locality-aware Parallel Decoding for Efficient Autoregressive Image Generation(面向高效自回归图像生成的局部感知并行解码)


[04:33] 🎬 STR-Match: Matching SpatioTemporal Relevance Score for Training-Free Video Editing(STR-Match: 匹配时空相关性得分的免训练视频编辑方法)


[05:14] 📊 MARVIS: Modality Adaptive Reasoning over VISualizations(MARVIS:基于可视化的模态自适应推理)


[05:51] 🗣 JAM-Flow: Joint Audio-Motion Synthesis with Flow Matching(JAM-Flow:基于流匹配的联合音频-运动合成)





【关注我们】


您还可以在以下平台找到我们,获得播客内容以外更多信息


小红书: AI速递

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧