2025-03-29 | Anthropic 发布研究揭示了这些复杂系统是如何进行思考的

探索大型语言模型背后的思维路径 [Large Language Model Exploration] 大型语言模型如 Claude 并不完全由人类直接编程,而是在大量数据的训练下,自行发展解决问题的策略。论文中介绍了一种新的“AI 显微镜”方法,能够帮助研究人员理解这些复杂的思维路径,其中包括模型如何生成押韵诗句和在多语言环境下共享思维过程的能力。这个研究对于提升我们对 AI 系统的理解和信任至关重要。 文章链接: Tracing the thoughts of a large language model HN 链接: HN Discussion 苹果,重拾雪豹精神,为软件质量护航 [Apple Needs a Snow Sequoia 配图] 在软件质量问题频发的今天,许多用户和开源爱好者发出呼声,呼吁苹果回归“雪豹”时代的精益求精。与以往不断推陈出新的做法相比,用户希望苹果在 MacOS 和 iOS 更新中加入更稳固的性能优化,而不是仅仅追求新功能的展示。“雪豹”作为苹果历史上最为稳定的软件版本之一,让人忆及其稳健的系统架构和极少的故障。这意味着科技巨头需要在人工智能等新兴领域投入的同时,专注提升现有产品的稳定性和整体用户体验。 文章链接: Apple needs a Snow Sequoia HN 链接: Apple Needs a Snow Sequoia - Hacker News Hacker News 难解的讨论谜团 [Daring Fireball] Daring Fireball,是一家深受技术社群关注却在 Hacker News 上频频遭遇“消声”的科技博客。本期我们深度解析这篇备受争议的文章,探讨 Hacker News 的“择优”算法是否对内容创作者不公平,以及为何极富见解的文章常被限流。评论中,有人认为 Gruber 的作品因其对 Apple 的偏爱引发了两极反馈,而这种现象正是算法权衡下的无奈之举。 阅读原文 HN 链接: Hacker News 讨论 如何正确使用破折号、短杠和连字符 [Em Dashes, En Dashes, and Hyphens: A Comprehensive Guide] 在书写中,破折号(—)、短杠(–)与连字符(-)常常用来传达不同的语法意义。破折号可以用于表示句子的突然变化或中断,短杠常用于连接数字范围,而连字符则用于连接复合词。对于许多作者来说,正确使用这些标点符号能极大地提升文本的专业性和可读性。 原文链接: How to Use Em Dashes (—), En Dashes (–), and Hyphens (-) HN 链接: news.ycombinator.com 自制人造阳光:DIY 光线工程的成功尝试 [人工阳光实验] 通过采用多灯贴片设计和透镜阵列,一个业余爱好者尝试使用自制的设备模拟自然阳光。这一创新项目不仅紧凑,还在照明效果上取得了一定的成功,尽管亮度还需提升。但即便如此,作者对于他首次设计的成果感到十分自豪。 原文链接: I tried making artificial sunlight at home HN 链接: Hacker News Discussions 神奇的透视效果:解密 Piranesi 的视觉欺骗 [Piranesi's Perspective Trick] 在本文中,作者 Bruno Postle 深入探讨了十八世纪艺术家 Giovanni Battista Piranesi 的独特透视技法。Piranesi 的作品以其引人入胜的透视效果而著称,这些效果在现代摄影中是难以复制的,因其能在不失真实性的同时呈现出广阔而精致的场景。此技术不仅在视觉上引人入胜,而且在当时的艺术界产生了深远的影响。 阅读原文 HN 链接: Hacker News Kagi 搜索引擎的最频繁提升与封锁域名揭晓 [Kagi Domain Leaderboard] 在 Kagi 搜索引擎中,哪些域名被提升和封锁最多呢?根据最新统计,Pinterest 在封锁域名中名列前茅,这也引发了关于 Google 图片搜索的策略的讨论。此外,许多软件开发相关的网站被用户广泛提升,显示出 Kagi 用户群体中特定的兴趣倾向。有评论指出,这可能意味着 Kagi 的使用者主要集中在 web 开发者中,而不是更广泛的互联网用户。 原文链接: Most promoted and blocked domains on Kagi HN 链接: Hacker News 讨论 人工智能诊断中的种族与性别偏差问题 [AI models miss disease in Black and female patients] 科学研究显示,常用的人工智能疾病检测模型在对黑人士和女性患者进行诊断时,往往无法准确发现疾病。这项研究强调了监控人工智能工具中的偏见问题的重要性,以确保其对所有群体都能提供公平的医疗服务。这一发现警示我们,尽管技术在不断进步,但人类必须参与以确保其应用的公正性。 文章链接:AI models miss disease in Black and female patients HN 链接: AI models miss disease in Black and female patients on Hacker News 绕过 WebP 的漏洞:分解 NSO 的 BLASTPASS iMessage 攻击 [NSO BLASTPASS iMessage exploit analysis] NSO Group 的最新武器 BLASTPASS,利用了 WebP 格式的漏洞成为业界关注的焦点。这个攻击链可以在无需受害者互动的情况下,完全控制运行最新 iOS 系统的 iPhone。攻击使用 PassKit 附件发送恶意图片,通过 Apple iMessage 渗透,将安全性推向极限。一些专家评论该漏洞背后的技术复杂性令人惊叹,而苹果的防御显得薄弱。 原文链接 HN 链接: Hacker News 讨论

10分钟
99+
3个月前

2025.03.28 | 视频推理提升,GUI动作预测优化

本期的 15 篇论文如下: [00:22] 🧠 Video-R1: Reinforcing Video Reasoning in MLLMs(Video-R1:增强多模态大语言模型中的视频推理) [01:02] 📱 UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning(UI-R1:通过强化学习增强GUI代理的动作预测) [01:41] 🤯 Challenging the Boundaries of Reasoning: An Olympiad-Level Math Benchmark for Large Language Models(挑战推理的边界:一个面向大型语言模型设计的奥林匹克级别数学基准) [02:25] 🎬 VBench-2.0: Advancing Video Generation Benchmark Suite for Intrinsic Faithfulness(VBench-2.0: 提升视频生成基准套件的内在真实性) [03:05] 🖼 LeX-Art: Rethinking Text Generation via Scalable High-Quality Data Synthesis(LeX-Art:通过可扩展的高质量数据合成重新思考文本生成) [03:38] 🤖 Large Language Model Agent: A Survey on Methodology, Applications and Challenges(大型语言模型智能体:方法论、应用与挑战综述) [04:23] 🧠 ReaRAG: Knowledge-guided Reasoning Enhances Factuality of Large Reasoning Models with Iterative Retrieval Augmented Generation(ReaRAG:知识引导的推理增强大型推理模型的事实性,通过迭代检索增强生成) [05:01] 🖼 Lumina-Image 2.0: A Unified and Efficient Image Generative Framework(Lumina-Image 2.0:一个统一且高效的图像生成框架) [05:48] 🤖 Embodied-Reasoner: Synergizing Visual Search, Reasoning, and Action for Embodied Interactive Tasks(具身推理器:协同视觉搜索、推理和行动以完成具身交互任务) [06:27] 💡 ResearchBench: Benchmarking LLMs in Scientific Discovery via Inspiration-Based Task Decomposition(ResearchBench:基于灵感驱动的任务分解评估大语言模型在科学发现中的能力) [07:12] 🚀 Optimal Stepsize for Diffusion Sampling(扩散采样的最优步长) [07:46] 🤔 Exploring the Evolution of Physics Cognition in Video Generation: A Survey(视频生成中物理认知进化探索:一项综述) [08:24] 🎤 FinAudio: A Benchmark for Audio Large Language Models in Financial Applications(FinAudio:金融应用中音频大语言模型的基准测试) [09:01] 🗣 ChatAnyone: Stylized Real-time Portrait Video Generation with Hierarchical Motion Diffusion Model(ChatAnyone:基于分层运动扩散模型的风格化实时人像视频生成) [09:40] 🧠 ZJUKLAB at SemEval-2025 Task 4: Unlearning via Model Merging(ZJUKLAB团队在SemEval-2025 Task 4:通过模型融合实现知识遗忘) 【关注我们】 您还可以在以下平台找到我们,获得播客内容以外更多信息 小红书: AI速递

10分钟
92
3个月前

64. 2025 在一个(隐性)营养不良的时代,“吃”点好的|王璐dk

好久不见!这一期对谈发生在2025年1月8日。随后我进入了一段远离社交媒体的生活——不需要跟随外界的时间表,随心而动,对这几年的经历做了一些深层梳理与消化。这一期聊了很多AI话题,放在「储藏室」里未发表的时间段里,目睹AI热潮席卷中国...让我觉得,有时候precognition是很好玩的一件事情。这一期足足有3个小时!建议你收藏,分段聆听。 听完这期播客,是否意识到,我们每天被算法投喂的罐头音乐和AI内容,是另一种“科技狠活”?你最近有手动分享过真正滋养心灵的宝藏“营养”内容吗? Shownotes 00:00 Happy 2025 and Life Update 2025初始计划! 08:55 Episode Preview 3小时对谈总览 26:11 Exploring the Intersection of Music and Technology 听觉实验与灵感来源 31:00 Personalization vs. Depersonalization in Music 个性化音乐体验的意义 36:59 The Evolution of Music Curation 音乐平台的选择、推送机制与用户体验 43:02 The Balance Between Art and Commerce in Music 技术与商业模式的平衡 49:00 The Role of Artists in a Tech-Driven World 艺术家在一个技术驱动的世界中该怎么办? 54:39 The Search for Authenticity in Music 在音乐中寻找真实 01:02:13 The Impact of Social Media on Mental Health and Psychological Manipulation 社交媒体对人类进化与心理健康的影响与心理操控 01:07:44 Purpose: Music or Money? 当不听音乐的人在做音乐产品 01:13:20 Navigating Music Platforms and Algorithms 如何反向训练音乐平台与算法 01:19:45 The decline of Nutrition for Physical and Mental Health in the last century 过去一百年间,生理营养与精神营养平均水平在下降 01:30:03 Keep yourself in tune before you can help others “乐器”与“调音”的另一层含义 01:34:42 Tell VS Inspire 告诉VS启发 01:40:23 The Anxiety of Accumulation 群体性焦虑:焦虑与囤积行为的心理分析 01:42:52 A society that sees kindness as a weakness is toxic. 把善良当成弱点的社会是病态的 01:43:19 Awareness in individuals can cause collective stumbling. 个人一知觉,集体就踉跄 01:45:49 When biology are used for massive manipulation 当生命科学的发展被用于群体性操纵 01:47:12 Does perfect exist? 完美的人存在吗? 01:51:28 The Role of Music in Emotional Healing 音乐的疗愈力量来源于对情感的滋养 01:55:45 Digital Distraction is taking away your Attention and Ability to Love 注意力稀薄导致爱的缺失、人际能力下降 02:01:34 The Destructive Impact of Social Media on Mental Health and Child Development 社交媒体对亲子关系、心理健康的破坏性影响 02:21:04 Digital Drugs and Cognitive Development 过早接触电子产品对儿童认知发展的损害 02:23:37 As children, we mimic the relationship patterns we see on media. 儿时看到的电视剧影响我们的亲密关系 02:26:32 AI and Human Relationships 人机交互关系的演变 02:33:22 The Future of Human Evolution : Is it diversity? 人类进化方向是更多元化吗? 02:35:38 The Dangers of Over-Reliance on Intellect 过度依赖智力、忽略身体智慧的危险 02:39:26 The Rise of Sensory Integration Dysfunction 儿童感统失调数量激增 02:43:12 The Need for Holistic Development 身心全面发展的需求 02:45:57 Addressing user pain points is a false proposition. 解决用户痛点是个伪命题 02:48:36 Over-consumerism is compensating for life 过度消费是对某种缺失的弥补 02:54:05 The Need for Idle Time and Non-Purposeful Interactions 空闲时间与不带目的性的人际互动是我们的基本需要 02:55:56 Why consuming doesn't bring real satisfaction? 为什么消费无法让我们感到满足? 03:00:12 The Illusion of Consumerism and Identity 为什么说打卡是一种异化了的行为? 03:02:20 Be in the moment vs photography 珍贵的当下VS摄影记录 03:04:44 How Anxiety Creates Overconsumption 现代社会如何通过焦虑促使人们不断消费 03:07:22 Simplicity vs. Complexity in Modern Living 现代生活简单还是复杂? 03:08:31 Reflections on Music and Life 音乐的伙伴与生活的能量 嘉宾Bio DK(b. 1992), 王璐,先锋音乐人,作曲家。出生于内蒙古。于2016-2020年旅居欧洲与美国从事音乐创作活动。DK的音乐创作涉及电影、游戏、空间装置、实验歌剧、舞剧等。 DK的音乐创作基于现象学的理论基础,诉诸人的感知本质,结合音乐与New Media Art,空间,及物件,形成新表达,持续探索听感新边界。 2017-2020年旅居纽约期间,她开启了以物件为媒介,将数字作曲联动视觉变化,投射在不同的物件及空间上进行叙事的艺术创作手法,用全新的听感阐释科技与日常、空间与感知、社会问题与情感变化。 DK的音乐作品及艺术装置曾受邀在美国卡内基音乐厅,纽约时装周,纽约自然历史博物馆,伦敦Air Studio,上海当代艺术馆等进行展演。其担任作曲的电影作品多次入为海内外各大电影节并获得重要奖项。 伯克利音乐学院,纽约大学Tish艺术学院

193分钟
67
3个月前

N028.重启人生计划|对不起,这次我不想再当「好员工」了

本期到Norma播客串台,Norma是美国NYSE上巿公司DayDayCook日日煮创始人兼CEO,她也是显化身心灵的修行者。这次呢,在Norma的播客上分享了一下我的近况和我在显化方面的一些体会~我一直相信:珍惜生活对你的每一次推动,珍惜每一次可以去探险的机会,当下就是最好的机会! |本期嘉宾| Norma Chu:美国NYSE上巿公司DayDayCook日日煮创始人兼CEO, 哈佛商学院 HBS Alumni, YPO 北亚区董事会成员, 中国媒体百大人物, 显化身心灵修行 daily practitioner。 欢迎关注Norma的播客:「Normally speaking」 |时间轴| 02:16:ice近期的新变化 04:02:裸辞原因,以及做了哪些准备? 05:03:ice将要开启的Life Coach体验 09:20:ice裸辞后的下一步计划是什么 10:59:ice初次接触显化的经历 13:47:ice的2024显化目标!基本上都实现啦!! 15:55:比较标准的显化五大步骤 18:43:卡点不是阻碍你,是帮助你成功的~ 19:56:ice推荐「显化」鼻祖——内维尔‧戈达德 22:15:内维尔的核心思想 23:35:显化的误区:不是显化“我想要”,而是显化“我已经得到” 25:05:Norma的视觉化练习是怎样的 27:57:Norma显化入门的建议 30:04:人生就是一个很好玩的游戏,面对生活里的挑战要像面对游戏里的boss一样! |本期音乐| 《Hey》-Anthony Lazaro 小宇宙|网易云音乐|喜马拉雅|苹果播客|QQ音乐|微博 |制作团队| 主播:徐冰ice 剪辑:徐冰ice

36分钟
99+
3个月前

V25. 耶路撒冷三千年(14): 东方的拿破仑和那个宗教狂热的年代

本期节目将介绍《耶路撒冷三千年》东方的拿破仑和迷信的年代,作者西蒙·蒙蒂菲奥里Simon Sebag Montefiore. 上一期我们讲了《耶路撒冷三千年》的前35章,让大家对拿破仑在耶路撒冷的战役有了一定的了解。这一期,咱们就来讲讲东方的拿破仑和遥远的神学年代。 节目大概: 00:45 阿尔巴尼亚战士 [图1. 穆罕默德·阿里] 03:21 [图2. 红色易卜拉欣] 08:24 [图3. 阿卜杜拉-迈吉德] 09:30 英国如何挤进耶路撒冷? 14:45 美国的宗教狂热 18:44 俄国与克里米亚战争 28:42 下期节目预告 背景音乐: 1、Big Band Show 2、God Save The King - City of London Choir, Royal Philharmoinc Orchestra, Hilary Daven Wetton (2022) 3、God, Save the Tsar - The Male Orthodox Choir (2000) 4、Shalom Aleychem - Maayan Band (2020) 5、The Star Spangled Banner (美国国歌) - The American Orchestra (2012) 6、Üsküdar'a Gider İken - Sait Ağdaş (2019) 7、Zayed Al Wafa Liyakun Yawmuka - NEK BANDA 786 (2024) 8、阿拉伯之夜 - 孙玉镜 (2021) 【节目主播】 楼前柳: 95后,意大利华侨,北京人。目前从事纺织外贸工作,英国利兹大学国际市场管理的硕士和英国利物浦大学的历史本科。暂时不公开其他社媒。商务合作请联系邮箱:[email protected]. 非常感谢! 【节目嘉宾】 Martin马丁:阳光外向e人,Instagram账号:@__mwa__ Michael王古达:来自以色列的内向社恐i人,不公开社媒账号。 参考文献 1、西蒙·蒙蒂菲奥里:《耶路撒冷三千年》,张倩红、马丹静译,北京:民主与建设出版社,2015年。 图片来源 图1. 穆罕默德·阿里, Wikipedia, 网站: commons.wikimedia.org,获取时间:2024年10月18日。 图2. 红色易卜拉欣, Wikipedia, 网站: zh.wikipedia.org易卜拉欣帕夏#/media/File:Portrait_d'Ibrahim_Pacha_2.JPG, 获取时间:2024年10月18日。 图3. 阿卜杜拉-迈吉德, Wikipedia, 网站: commons.wikimedia.orgülmecid_-_Google_Art_Project.jpg, 获取时间:2024年10月18日。 嘉宾原文和中文翻译访谈内容 * 播客播出平台:小宇宙、喜马拉雅、荔枝FM、Spotify、苹果播客、QQ音乐、网易云音乐、蜻蜓FM * 如果你喜欢我的节目,欢迎订阅、留言、点赞、转发和收藏~ *声明:本节目的内容仅代表个人观点,不代表任何组织或人群的立场,也不能构成任何专业的学术建议。本节目仅供历史科普,不能作为任何专业学术论文等参考文献。

30分钟
99+
3个月前

019. Honor: 当爱跨越宗教,却无法跨越仇恨

如果你曾踏足印度,走过孟买熙熙攘攘的街头,或是远远地看过泰姬陵晨曦中的光影,那么你或许能理解,印度是一个充满矛盾的国度。它既有生生不息的活力,也有深植于历史的沉重枷锁。而在这样的土地上,有些人的爱情,注定成为时代和信仰冲突下的牺牲品。 《Honor》讲述的正是这样一个故事——一位印度教女子 Meena,因嫁给穆斯林男子而被自己的家人残忍报复。另一位来自美国的印度裔记者 Smita 受托回国报道这个案件,本以为只是一次短暂的职业任务,然而随着她的深入,她发现自己无法仅仅作为旁观者。她被迫面对印度社会最残酷的一面,同时也不得不重新审视自己的身份、过去和那些未曾解开的伤口。 小说不仅仅是关于 Meena 的悲剧,更是关于无数女性的命运。当宗教成为枷锁,当家族的荣耀凌驾于个人自由之上,我们不禁要问:“Honor”究竟意味着什么?它是值得守护的尊严,还是必须撕裂的枷锁?它是公正,还是暴力的遮羞布? 从《Honor》到现实,印度的宗教冲突依然在继续,女性的命运依然摇摆在传统与现代之间。可是,正如这本书所展现的,哪怕在最黑暗的角落,也总有人愿意发声,总有人仍然相信爱,相信改变。 小说的灵感来源: In India, a Small Band of Women Risk It All for a Chance to Work 03:58 作者介绍 07:09 印度经济 15:19 小说内容 1:08:03 印度的宗教 1:18:04 印度的种姓制度 1:27:54 推不推荐这本书 1:30:30 下期预告:Chaos: Charles Manson, the CIA, and the Secret History of the Sixties

93分钟
99+
3个月前

外刊精讲 | “白宫群聊”门续集:川懵了,白宫认了,防长否了,欧洲惊了

【欢迎订阅】 每天早上5:30,准时更新。 【阅读原文】 标题:Intelligence Officials Face a Fresh Round of Questions About Signal Leak Democrats on a House committee appeared in lock step as they confronted one of the most notable blunders of the T administration. 正文:Members of President T’s cabinet insisted at a House committee hearing on Wednesday that there was nothing wrong with using a consumer messaging app to discuss U.S. military plans to strike Houthi targets in Yemen. On Tuesday, the spy chiefs told the Senate that they did not believe any of their material, nor classified “intelligence,” had been exposed in the chat, where senior officials discussed the timing, advisability and possible targets of the administration’s planned airstrikes on Houthis in Yemen. Their answer at least left open the idea that some of the Pentagon plans shared in the chat might have been classified. 知识点:hearing n. /ˈhɪərɪŋ/ an official meeting where evidence or arguments are presented. 听证会 e.g. The court scheduled a hearing to review the new evidence. 法庭安排了一场听证会来审查新证据。 获取外刊的完整原文以及精讲笔记,请关注微信公众号「早安英文」,回复“外刊”即可。更多有意思的英语干货等着你! 【节目介绍】 《早安英文-每日外刊精读》,带你精读最新外刊,了解国际最热事件:分析语法结构,拆解长难句,最接地气的翻译,还有重点词汇讲解。 所有选题均来自于《经济学人》《纽约时报》《华尔街日报》《华盛顿邮报》《大西洋月刊》《科学杂志》《国家地理》等国际一线外刊。 【适合谁听】 1、关注时事热点新闻,想要学习最新最潮流英文表达的英文学习者 2、任何想通过地道英文提高听、说、读、写能力的英文学习者 3、想快速掌握表达,有出国学习和旅游计划的英语爱好者 4、参加各类英语考试的应试者(如大学英语四六级、托福雅思、考研等) 【你将获得】 1、超过1000篇外刊精读课程,拓展丰富语言表达和文化背景 2、逐词、逐句精确讲解,系统掌握英语词汇、听力、阅读和语法 3、每期内附学习笔记,包含全文注释、长难句解析、疑难语法点等,帮助扫除阅读障碍。

19分钟
1k+
3个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧