Album
时长:
5分钟
播放:
131
发布:
1个月前
主播...
简介...
https://xiaoyuzhoufm.com

本期的 10 篇论文如下:


[00:24] 🧠 A Survey of Reinforcement Learning for Large Reasoning Models(大型推理模型的强化学习综述)


[00:45] 🔄 RewardDance: Reward Scaling in Visual Generation(RewardDance:视觉生成中的奖励缩放)


[01:08] 🌐 3D and 4D World Modeling: A Survey(3D和4D世界建模:一项综述)


[01:41] 🤖 AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning(AgentGym-RL: 通过多轮强化学习训练用于长视野决策制定的LLM智能体)


[02:08] 🧩 P3-SAM: Native 3D Part Segmentation(P3-SAM:原生3D部分分割)


[02:40] 🌐 Hunyuan-MT Technical Report(Hunyuan-MT技术报告)


[03:08] ⚠ <think> So let's replace this phrase with insult... </think> Lessons learned from generation of toxic texts with LLMs(从LLM生成有毒文本中吸取的经验教训)


[03:44] 🤖 EnvX: Agentize Everything with Agentic AI(EnvX:使用代理式AI实现万物代理化)


[04:13] 🤔 The Majority is not always right: RL training for solution aggregation(多数并不总是正确:用于解决方案聚合的强化学习训练)


[04:33] 🤖 HumanAgencyBench: Scalable Evaluation of Human Agency Support in AI Assistants(HumanAgencyBench:AI助手中人类代理支持的规模化评估)





【关注我们】


您还可以在以下平台找到我们,获得播客内容以外更多信息


小红书: AI速递

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧