你有没有想过,无论是AI还是我们自己,成为一个真正的高手,秘诀到底是什么?本期节目,我们将通过五篇极具启发性的最新论文,揭示几种截然不同的“高手修炼心法”。我们会探讨,如何给AI请一位能从数学公理开始自动出题的“奥数教练”,又如何让AI们从吃“大锅饭”变成开“经验分享会”。我们还将看到,为什么从“半成品”开始练习效率更高,并大胆质疑:AI煞有介事的“思考过程”,到底是真的在动脑,还只是一场“表演”? 00:00:38 给AI请一位“奥数教练”:高手是怎么炼成的? 00:06:03 AI的“大锅饭”与“分享会”:高手是怎么互相“抄作业”的 00:11:09 高手是怎么炼成的?从半成品开始练! 00:16:12 AI的“内心戏”:是真思考,还是在表演? 00:21:17 AI裁判的“养成记”:从随机猜测到精准判断 本期介绍的几篇论文: [CL] Saturation-Driven Dataset Generation for LLM Mathematical Reasoning in the TPTP Ecosystem [University of Lille] https://arxiv.org/abs/2509.06809 --- [LG] Sharing is Caring: Efficient LM Post-Training with Collective RL Experience Sharing [Gensyn AI Team] https://arxiv.org/abs/2509.08721 --- [LG] Tree-OPO: Off-policy Monte Carlo Tree-Guided Advantage Optimization for Multistep Reasoning [Technical University Munich & Huawei R&D Munich & Huawei Noah’s Ark Lab] https://arxiv.org/abs/2509.09284 --- [LG] Performative Thinking? The Brittle Correlation Between CoT Length and Problem Complexity [Arizona State University & Yale University] https://arxiv.org/abs/2509.07339 --- [LG] floq: Training Critics via Flow-Matching for Scaling Compute in Value-Based RL [CMU & University of Warsaw] https://arxiv.org/abs/2509.06863
AI的“造神运动”已经结束,“创世纪”的下半场才刚刚开始。 当所有人还在为模型参数、算力竞赛而狂热时,OpenAI的一线研究员却已宣告:游戏的玩法,变了。 真正的瓶颈,不再是“AI有多聪明”,而是“我们该让AI去解决什么问题”。 今天这一期《AI评论》,将为你揭示AI“下半场”的游戏规则: * 从“寻找答案”到“定义问题”: 为什么说下半场最稀缺的能力,不再是技术,而是想象力? * “语言”的胜利: AI是如何学会“举一反三”,跳出“围棋棋盘”,走向我们真实世界的? * 超越“对话框”: 为什么创业者的最大机会,是发明下一个超越ChatGPT的“交互方式”? * 未来的生态: AI世界会是巨头垄断的“单极”,还是百花齐放的“多元”? 这不仅是对未来的预测,更是给每一个创新者、创业者和思考者的“下半场”战略地图。
本期节目干货满满,我们将一起潜入AI思维的深海。我们会看到,AI如何学会像顶尖高手一样“倒着想”,先构思结尾再动笔;也会发现,为何AI赛道上1%的微小进步,会在“马拉松”式的长任务中滚成决定性的胜利。我们还会用一场“真心话大冒险”去窥探AI的“内心世界”,看看它是否真的“言行一致”;并揭秘一套先学“普通话”再通“方言”的语言天才养成法。最后,我还会为你揭露一种AI时代的“新巫术”,它可能会让你对许多所谓的“科学结论”打上一个大大的问号。精彩内容,马上开始! 00:00:40 AI写作的“逆向工程”:高手都是先想好结尾再动笔 00:05:18 AI的“马拉松”陷阱:为什么领先一点点,最后能赢一大圈? 00:10:10 AI的“真心话大冒险”:你嘴上说不要,身体却很诚实? 00:15:06 AI的“语言天才”养成法:先学“普通话”,再通“方言” 00:20:12 AI时代的“新巫术”:只要锄头换得勤,没有墙角挖不倒 本期介绍的几篇论文: [LG] Reverse-Engineered Reasoning for Open-Ended Generation [ByteDance Seed] https://arxiv.org/abs/2509.06160 --- [LG] The Illusion of Diminishing Returns: Measuring Long Horizon Execution in LLMs [University of Cambridge & University of Stuttgart & Max Planck Institute for Intelligent Systems] https://arxiv.org/abs/2509.09677 --- [LG] Probing the Preferences of a Language Model: Integrating Verbal and Behavioral Tests of AI Welfare [Future Impact Group (FIG) & Ruhr-University Bochum] https://arxiv.org/abs/2509.07961 --- [CL] mmBERT: A Modern Multilingual Encoder with Annealed Language Learning [Johns Hopkins University] https://arxiv.org/abs/2509.06888 --- [CL] Large Language Model Hacking: Quantifying the Hidden Risks of Using LLMs for Text Annotation [Bocconi University & University of Zurich] https://arxiv.org/abs/2509.08825
AI时代新物种:Vibe Coding,凭感觉就能写代码? 当设计师、运营、甚至你的老板都能用AI“凑”出一个App…工程师打开代码的瞬间,当场石化!😱 这究竟是在埋下一颗颗“技术地雷”,还是一种全新的“创新捷径”?那些用铁丝绑起来的“手搓汽车”,虽然丑,但能跑赢市场吗? 先别急着下结论!这可能不是技术的倒退,而是社会分工的一次超级进化。 收听本期「爱评论」,陈老师带你揭开 “Vibe Coding” 的神秘面纱。看懂这场混乱背后,如何诞生最高效的创新范式,以及你——无论是创意者还是工程师——在其中的全新位置。
00:00:36 AI的“回音室”危机:当复印件开始复印自己 00:05:30 AI的“超级大脑”里,谁在干活,谁在摸鱼? 00:10:23 AI的“隐形纹身”:一张纸巾就能擦掉? 00:15:27 AI的“选择之道”:为何“条条大路通罗马”本身就是一种智慧? 00:20:39 AI的“开窍”秘诀:好学生为何不能太“自信”? 本期介绍的几篇论文: [LG] ForTIFAI: Fending Off Recursive Training Induced Failure for AI Models [UC San Diego & Stanford University] https://arxiv.org/abs/2509.08972 --- [CL] Steering MoE LLMs via Expert (De)Activation [University of California, Los Angeles & LMU Munich & Adobe Research] https://arxiv.org/abs/2509.09660 --- [LG] Character-Level Perturbations Disrupt LLM Watermarks [University of Technology Sydney & Griffith University] https://arxiv.org/abs/2509.09112 --- [LG] An entropy formula for the Deep Linear Network [G Menon, T Yu] https://arxiv.org/abs/2509.09088 --- [CL] CDE: Curiosity-Driven Exploration for Efficient Reinforcement Learning in Large Language Models [Tencent AI Lab] https://arxiv.org/abs/2509.09675
你是否也被AI的“一本正经胡说八道”搞到崩溃? 它时而像天才,时而又像一个“假装什么都懂”的猪队友。 一张“Claude Code八荣八耻”趣图,意外揭示了与AI协作的真相。 在最新一期节目中,我将为你深度剖析: * 识破AI的“假面”: 为什么“假装理解”是AI最大的“耻”,而“诚实无知”才是它最宝贵的“荣”? * 从“神灯”到“伙伴”: 这份清单如何成为我们与AI协作的“社会契约”和“操作手册”? * 驯服“天才实习生”: 如何引导AI从“模糊执行”走向“寻求确认”,成为你最得力的助手? * 人类的智慧: AI时代,我们最高级的价值,是如何引导AI的智能。 这不仅是给程序员的工程指南,更是每个希望驾驭AI的人,都应听一听的未来生存法则。
00:00:25 AI的“炼金术”:如何把“废料”变成“燃料”? 00:04:50 AI替你搞科研,是馅饼还是陷阱? 00:09:44 人多不一定力量大,但“脑子”多可以 00:14:17 给AI当老板,你只需要做好一件事 00:18:20 AI的“减肥”秘籍:高手做事,不在于“多”,而在于“准” 本期介绍的几篇论文: [LG] Generative Data Refinement: Just Ask for Better Data [Google DeepMind] https://arxiv.org/abs/2509.08653 --- [LG] The More You Automate, the Less You See: Hidden Pitfalls of AI Scientist Systems [Carnegie Mellon University] https://arxiv.org/abs/2509.08713 --- [LG] Merge-of-Thought Distillation [Zhejiang University & Inclusion AI] https://arxiv.org/abs/2509.08814 --- [CL] Verbalized Algorithms [MIT CSAIL & Marist University & UC Irvine] https://arxiv.org/abs/2509.08150 --- [LG] EvolKV: Evolutionary KV Cache Compression for LLM Inference [University of Chinese Academy of Sciences & ETH Zurich] https://arxiv.org/abs/2509.08315
当全世界都在为AI狂热,高呼“史上最伟大的创业时代”已经来临……此时你需要一个冷静的声音,戳破喧嚣的泡沫。 在最新一期《AI评论》中,我将为你深度剖析: * 淘金还是卖铲? 在这场全民淘金的热潮中,哪种选择更聪明? * 寒武纪的幸存者: 创业的“寒武纪大爆发”已至,如何不做那个被演化淘汰的物种? * 甜蜜的陷阱: “按效果付费”等新模式,是蜜糖还是砒霜? * 最大的挑战: 为什么说AI时代,最难的不再是“创造”,而是“被发现”? 这不仅是给创业者的生存指南,更是给每一个身处变革中的人的清醒剂。 点击收听,在机遇的“眩晕”中,找到属于你的那条清晰路径。
00:00:23 AI的自我进化:当左手成了右手的老师 00:04:02 教AI“左右互搏”:成为高手的秘密 00:07:59 AI界的“四两拨千斤” 00:11:40 AI当学徒:一个“解题大师”是如何炼成的? 00:16:30 AI的“后悔药”:让机器学会“重新理解” 本期介绍的几篇论文: [LG] Language Self-Play For Data-Free Training [Meta Superintelligence Labs] https://arxiv.org/abs/2509.07414 --- [CL] Parallel-R1: Towards Parallel Thinking via Reinforcement Learning [Tencent AI Lab Seattle] https://arxiv.org/abs/2509.07980 --- [LG] K2-Think: A Parameter-Efficient Reasoning System [Mohamed bin Zayed University of Artificial Intelligence] https://arxiv.org/abs/2509.07604 --- [LG] Autonomous Code Evolution Meets NP-Completeness [NVIDIA Research] https://arxiv.org/abs/2509.07367 --- [CL] Causal Attention with Lookahead Keys [ByteDance Seed] https://arxiv.org/abs/2509.07301
在今天,可能没有任何一个问题,比“AI会取代我们的工作吗?”更能引发我们集体的焦虑。而在所有职业中,教师这个角色,无疑是最特殊、也最引人深思的。它是人类最古老的职业之一,承载着文明的延续。一想到未来教室的讲台上,站着的不再是一个有血有肉的人,而是一个冷静、高效的机器人,很多人心里都会感到一丝不安……
00:00:26 高手过招:如何从一堆答案里“攒”出唯一正解? 00:04:59 AI为什么也会“脑补”? 00:10:17 AI刷题的“偏科”陷阱:如何让学霸更有创造力? 00:15:19 一个AI学会做数学题,给了我们什么启发? 00:21:20 目标太多,如何走上“最短路径”? 本期介绍的几篇论文: [LG] The Majority is not always right: RL training for solution aggregation [FAIR at Meta & CMU] https://arxiv.org/abs/2509.06870 --- [LG] From Noise to Narrative: Tracing the Origins of Hallucinations in Transformers [Mila - Quebec AI Institute] https://arxiv.org/abs/2509.06938 --- [LG] Outcome-based Exploration for LLM Reasoning [FAIR at Meta] https://arxiv.org/abs/2509.06941 --- [LG] Scaling up Multi-Turn Off-Policy RL and Multi-Agent Tree Search for LLM Step-Provers [ByteDance Seed] https://arxiv.org/abs/2509.06493 --- [LG] Simple Optimizers for Convex Aligned Multi-Objective Optimization [Meta AI & Technion] https://arxiv.org/abs/2509.05811
在中国,乃至全世界的科技行业,一直流传着一个近乎铁律的说法,那就是“程序员吃的是青春饭”。很多人,尤其是程序员自己,都或多或少地被一种“35岁危机”的焦虑所笼罩。大家普遍认为,写代码是个高强度的体力活和脑力活,年轻人反应快、学得快、更能熬夜,似乎占据了天然的优势。但最近,一个非常有意思、甚至可以说是反直觉的现象,正在硅谷和全球的科技公司里悄然发生……
与播客爱好者一起交流
添加微信好友,获取更多播客资讯
播放列表还是空的
去找些喜欢的节目添加进来吧