评分
暂无评分
0人评价
5星
0%
4星
0%
3星
0%
2星
0%
1星
0%
AI智能总结...
AI/summary > _
AI 正在思考中...
本集内容尚未生成 AI 总结
简介...
https://xiaoyuzhoufm.com

本期的 14 篇论文如下:

[00:26] 🎨 Style-Friendly SNR Sampler for Style-Driven Generation(风格友好SNR采样器用于风格驱动生成)

[01:08] 🚀 TÜLU 3: Pushing Frontiers in Open Language Model Post-Training(TÜLU 3:推动开放语言模型后训练的前沿)

[01:53] 🌐 OminiControl: Minimal and Universal Control for Diffusion Transformer(OminiControl:扩散Transformer的最小且通用控制)

[02:31] 🛡 A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection(一种应用于离题提示检测的灵活大型语言模型防护开发方法)

[03:08] 🧠 Large Multi-modal Models Can Interpret Features in Large Multi-modal Models(大型多模态模型中的特征解释)

[03:49] 🎥 VideoEspresso: A Large-Scale Chain-of-Thought Dataset for Fine-Grained Video Reasoning via Core Frame Selection(视频浓缩:通过核心帧选择进行细粒度视频推理的大规模思维链数据集)

[04:29] 🎮 BALROG: Benchmarking Agentic LLM and VLM Reasoning On Games(BALROG:在游戏中评估代理型LLM和VLM的推理能力)

[05:13] 🎥 Efficient Long Video Tokenization via Coordinated-based Patch Reconstruction(基于协调的补丁重构高效长视频标记化)

[05:56] 👴 MyTimeMachine: Personalized Facial Age Transformation(我的时光机:个性化面部年龄转换)

[06:34] 🎥 Novel View Extrapolation with Video Diffusion Priors(基于视频扩散先验的新视角外推)

[07:10] 🎥 VideoRepair: Improving Text-to-Video Generation via Misalignment Evaluation and Localized Refinement(视频修复:通过错位评估和局部细化改进文本到视频生成)

[07:54] ☁ Adapting Vision Foundation Models for Robust Cloud Segmentation in Remote Sensing Images(适应视觉基础模型用于遥感图像中云分割的鲁棒性)

[08:31] 🤖 One to rule them all: natural language to bind communication, perception and action(一统天下:自然语言结合通信、感知与行动)

[09:15] 🤖 WildLMa: Long Horizon Loco-Manipulation in the Wild(野外长时程移动操作)

【关注我们】

您还可以在以下平台找到我们,获得播客内容以外更多信息

小红书: AI速递

主播...
拨号上网
评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧