Album
时长:
8分钟
播放:
89
发布:
9个月前
主播...
简介...
https://xiaoyuzhoufm.com

本期的 12 篇论文如下:


[00:26] 🧠 OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking(OmniThink:通过思考扩展机器写作的知识边界)


[01:06] 🔍 Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps(扩散模型推理时扩展:超越去噪步骤的扩展)


[01:37] 🩺 Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators(探索高级患者模拟器中的问诊与诊断关系)


[02:09] 🎨 SynthLight: Portrait Relighting with Diffusion Model by Learning to Re-render Synthetic Faces(SynthLight:基于扩散模型的人像重光照技术——通过重新渲染合成人脸学习)


[02:48] 🤖 FAST: Efficient Action Tokenization for Vision-Language-Action Models(FAST:视觉-语言-动作模型的高效动作标记化方法)


[03:23] 🔍 Learnings from Scaling Visual Tokenizers for Reconstruction and Generation(从视觉分词器的扩展中学习重建与生成)


[04:01] 🧠 Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models(迈向大型推理模型:基于大语言模型的强化推理研究综述)


[04:35] 🧹 The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating Large Language Models(堆:一个无污染的多语言代码数据集用于评估大型语言模型)


[05:15] 🤖 RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation(RLHS:通过事后模拟缓解RLHF中的错位问题)


[05:54] 🎨 AnyStory: Towards Unified Single and Multiple Subject Personalization in Text-to-Image Generation(AnyStory:面向统一单主体与多主体个性化的文本到图像生成)


[06:36] 🎨 CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation(CaPa:用于高效4K纹理网格生成的雕刻与绘制合成框架)


[07:18] 🎥 Do generative video models learn physical principles from watching videos?(生成视频模型是否通过观看视频学习物理原理?)





【关注我们】


您还可以在以下平台找到我们,获得播客内容以外更多信息


小红书: AI速递

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧