2025.02.28 | 自我校正提升数学推理,强化学习优化医疗推理。

HuggingFace 每日AI论文速递

本期的 19 篇论文如下: [00:23] 🧠 Self-rewarding correction for mathematical reasoning(自我奖励的数学推理校正) [01:03] 🧠 MedVLM-R1: Incentivizing Medical Reasoning Capability of Vision-Language Models (VLMs) via Reinforcement Learning(MedVLM-R1:通过强化学习激励视觉语言模型的医疗推理能力) [01:53] 🧠 R2-T2: Re-Routing in Test-Time for Multimodal Mixture-of-Experts(R2-T2:测试时重路由在多模态专家混合模型中的应用) [02:34] 🧬 LongRoPE2: Near-Lossless LLM Context Window Scaling(LongRoPE2:近乎无损的LLM上下文窗口扩展) [03:11] 🧠 FINEREASON: Evaluating and Improving LLMs' Deliberate Reasoning through Reflective Puzzle Solving(FINEREASON:通过反思性谜题解决评估和改进大语言模型的深思熟虑推理) [04:02] 🤖 CODESYNC: Synchronizing Large Language Models with Dynamic Code Evolution at Scale(CODESYNC:大规模动态代码演化与大型语言模型同步) [04:48] 🚀 Lean and Mean: Decoupled Value Policy Optimization with Global Value Guidance(精简与高效:基于全局价值引导的解耦价值策略优化) [05:33] 🧩 UniTok: A Unified Tokenizer for Visual Generation and Understanding(UniTok:面向视觉生成与理解的统一分词器) [06:12] 🚀 NeoBERT: A Next-Generation BERT(NeoBERT:下一代BERT) [06:47] 🌀 FlexiDiT: Your Diffusion Transformer Can Easily Generate High-Quality Samples with Less Compute(FlexiDiT:让你的扩散Transformer轻松生成高质量样本,计算量更少) [07:30] 🛠 SoRFT: Issue Resolving with Subtask-oriented Reinforced Fine-Tuning(SoRFT:面向子任务的强化微调问题解决方法) [08:07] 🤖 Building Interactable Replicas of Complex Articulated Objects via Gaussian Splatting(基于高斯样条构建复杂 articulated 物体的交互式副本) [08:45] 🎨 Multimodal Representation Alignment for Image Generation: Text-Image Interleaved Control Is Easier Than You Think(多模态表示对齐用于图像生成:文本-图像交错控制比你想象的更简单) [09:30] 🎥 Mobius: Text to Seamless Looping Video Generation via Latent Shift(Mobius:通过潜在位移从文本生成无缝循环视频) [10:08] 🛡 Guardians of the Agentic System: Preventing Many Shots Jailbreak with Agentic System(代理系统守护者:通过代理系统防止多次越狱) [10:49] 🤖 R1-T1: Fully Incentivizing Translation Capability in LLMs via Reasoning Learning(通过推理学习全面激励大语言模型中的翻译能力) [11:29] 🧠 On Relation-Specific Neurons in Large Language Models(关于大型语言模型中的关系特定神经元) [12:05] 🔄 Training Consistency Models with Variational Noise Coupling(基于变分噪声耦合的训练一致性模型) [12:46] ⚡ Efficient Gaussian Splatting for Monocular Dynamic Scene Rendering via Sparse Time-Variant Attribute Modeling(通过稀疏时变属性建模实现单目动态场景渲染的高效高斯光栅化) 【关注我们】 您还可以在以下平台找到我们,获得播客内容以外更多信息 小红书: AI速递

13分钟
99+
6个月前

特刊·滕丛丛:选一条喜欢的路,然后尽兴

过刊

【编者按】 去年大热的《我的阿勒泰》,让更多人记住了滕丛丛导演。她勾勒出了一种被向往的诗意,人穿过雾气,栖居在生活的腹地——复杂的赤诚,柔软的爽利,迷人的无果。但在出发前,《我的阿勒泰》并不算是完美匹配大众市场的作品。回想起来,滕丛丛说创作者还是要先去表达,才有被讨论的可能——“不符合主流市场趋势,没关系,通往结果的路是慢慢走到的,先去爱、去生活、去受伤。” 在三八妇女节即将到来之际,巴黎欧莱雅推出企划「没关系,每一步都值得」。本期节目为企划系列节目之一:我们重叙创作的旅途,分享漫长的跋涉。彼此鼓励而后确信,无论是快是慢、是顺流或逆旅,我们走过的每一步都值得。 【本期目录】 03:00 旅途中的戏剧性时刻 06:00 导演需要积累与人相处的经验 08:00 上青云之前,未能落地的尝试 10:00 我遗憾的,是我没有坚持自己 11:30 “无用”的细节里有作品的气质 14:00 慢点,阿勒泰会找到它的观众 19:00 女性觉醒瞬间,是你值得被爱 21:00 女导演、女性意识、女性创作 24:00 我们曾经花太多时间证明自己配得 27:00 你没必要去取悦社会上成功的定义 29:00 你很自由,就是成功的尽兴的一生 31:30 观众才是最终的裁判 34:00 握住话语权,去找到同伴 40:00 先全部输出,保持创作欲 41:00 我是一个写东西很奢侈的人 43:00 女性写作计划:去书写出你的权利 46:00 无论快慢,选一条喜欢的路去走吧 【关于过刊】 《过刊》是一档由左小姐和葛小姐共同编辑的泛文化播客,欢迎在小宇宙、喜马拉雅、网易云、苹果播客等处订阅收听。你可以在微博搜索“过刊编辑部”、小红书搜索“过刊”关注我们,那里会不时更新对应单集的图文信息。也可以发邮件到[email protected]联系我们。以及,欢迎大家多多在过刊评论,如若愿意也可在苹果播客、豆瓣上为我们评价打分,我们热烈期待着你的反馈。 【下期预告】 过刊072:三毛

51分钟
93k+
6个月前

V21. 耶路撒冷三千年(10): 鲍德温四世、萨拉丁和狮心王理查

你好历史书

本期节目将介绍《耶路撒冷三千年》十字军与穆斯林的圣战史,作者西蒙·蒙蒂菲奥里Simon Sebag Montefiore. 上一期我们讲了《耶路撒冷三千年》的前24章,让大家对十字军东征和王国的发展有了一定的了解。这一期,咱们除了要接着讲述历史,还会老样子继续看画像的! 节目大概: 00:33 [图1. 岩石圆顶清真寺] 01:50 [图2. 阿克萨清真寺] 02:46 [图3. 圣墓大教堂] 04:16 正文开始:麻风病国王鲍德温四世 08:36 居伊国王 13:11 萨拉丁 20:13 狮心王理查 25:09 穆斯林嘉宾对萨拉丁的评价 25:54 下期节目预告! 背景音乐: 1、Aghni Parthene (Агни Парфене) - Divna Ljubojevic (2008) 2、Big Band Show 3、Crusaders - Harry Gregson-Williams (2005) 4、Shalom Aleychem - Maayan Band (2020) 5、Zayed Al Wafa Liyakun Yawmuka - NEK BANDA 786 (2024) 6、阿拉伯之夜 - 孙玉镜 (2021) 7、宣礼声 - 马丁介绍的一位埃及小妹妹Sara在清真寺当场录的音。 【节目主播】 楼前柳: 95后,意大利华侨,北京人。目前从事纺织外贸工作,英国利兹大学国际市场管理的硕士和英国利物浦大学的历史本科。暂时不公开其他社媒。商务合作请联系邮箱:[email protected]. 非常感谢! 【节目嘉宾】 Martin马丁:阳光外向e人,Instagram账号:@__mwa__ 参考文献 1、西蒙·蒙蒂菲奥里:《耶路撒冷三千年》,张倩红、马丹静译,北京:民主与建设出版社,2015年。 图片来源 图1. 岩石圆顶清真寺,Pexels, 网址: www.pexels.com,获取时间:2024年10月18日。 图2. 阿克萨清真寺,Pexels, 网址: www.pexels.com,获取时间:2024年10月18日。 图3. 圣墓大教堂,Wikipedia, 网址: commons.wikimedia.org, 获取时间:2024年10月18日。 嘉宾原文和中文翻译访谈内容 * 播客播出平台:小宇宙、喜马拉雅、荔枝FM、Spotify、苹果播客、QQ音乐、网易云音乐、蜻蜓FM * 如果你喜欢我的节目,欢迎订阅、留言、点赞、转发和收藏~ *声明:本节目的内容仅代表个人观点,不代表任何组织或人群的立场,也不能构成任何专业的学术建议。本节目仅供历史科普,不能作为任何专业学术论文等参考文献。

29分钟
99+
6个月前

大众跑者跑到什么成绩,可以吃跑步这碗饭?|S3E4

信口开合·跑步播客

和业余精英跑者&专业跑步教练佳哥,聊聊他的跑者故事。 「言之有物,信口开合」,欢迎收听老菜狗信哥的跑步播客节目。 第三季的第四集,是我们在上一集和阿黑聊天过程中,解锁的一位新人物。 他跟信哥有很多相似之处,比如都不是科班出身,但都走向了靠跑步吃饭这条路。 他就是来自ARE Adidas Runners Elite的业余精英跑者,国一马拉松运动员,CP训练营主理人胡勇佳aka佳哥。 在本集的节目中,我们将聊聊他是如何从一个IT精英变成跑步教练,在不惑之年,达到国家一级马拉松运动员标准,并成为一名专业跑步教练的跑者故事。 嘉宾社交媒体账号:不惑跑者-佳哥 特别声明:嘉宾在节目中的发言仅代表个人观点。 -聊天的人- 主持:言信Shayne aka 老菜狗信哥 全职跑步内容创作者,业余精英跑者(全马PB2小时38分) 嘉宾:胡勇佳 aka 佳哥 CP训练营创始人,上海ARE成员,真·业余精英跑者(全马PB2小时31分17秒) -时间轴- 01:40 先从「明确的训练计划,精准的数据监控,靠谱的Pacer,以及彻底的执行力」聊起 06:32 为什么会想到成立自己的训练营,训练营目前已经自负盈亏了吗 11:38 大概是从什么时候起心动念,决定跳脱出原本的生活,开始靠跑步为生的 15:44 从哪一年开始系统训练,从破三到国一,这条路走的辛不辛苦 18:34 很多比赛都能跑出负分割,是如何做到的 21:17 对于配速的把握,非常的精准,是如何练出来的 23:25 跑步时的心率非常低,这个又是怎么做到的 25:14 训练和比赛几乎都会戴耳机,在听些什么,会不会影响到节奏 26:20 佳哥的家里,是不是只有阿迪的跑鞋 28:52 为什么会选择加入AR,最后还成为了ARE的一员,直到今日 35:26 发现CP的忠实会员非常多,是什么让CP有如此高的黏性,以及未来规划 39:29 现在的生活几乎全是围绕着跑步来转,家里人对佳哥的事业抱着什么样的态度 43:34 大众跑者跑到什么成绩,可以吃跑步这碗饭 46:39 目前的半马PB是113,但是全马才231,在全马上还有多大的提升空间 49:04 接触到很多的业余跑者,存在的通病是什么?有哪些因素,是制约我们进步的 54:30 用九年时间,在自己的左臂上文上了八行数字,为什么会选择把PB文在手臂上 57:05 那些没有跑好的比赛,给了佳哥哪些经验教训 1:02:57 对于中年男人如何去油腻这件事情上,有哪些好的建议 1:07:16 在今年的蒸蒸日上比赛之前的一晚,把号码簿从垃圾桶里捡出来,又去参赛的故事 1:12:06 尾声:给播客听众,CP训练营和ARE小伙伴的话 -补充资料- 播客提到的那堂围观训练课:xhslink.com 感谢「浪驰咖啡」提供的播客录制场所和美味手冲咖啡 地址:上海市浦东新区北蔡镇华鹏路142弄30号 -制作团队- 策划:言信Shayne 统筹:言信Shayne 制作:言信Shayne 运营:言信Shayne

80分钟
4k+
6个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧