节目列表: AI可可AI生活 - EarsOnMe - 精选播客，一听即合

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

你是否感觉努力到一定阶段就会遭遇瓶颈，或者在海量信息中难以抉择？本期我们要聊的几篇最新论文，就揭示了AI如何用更聪明的策略解决这些难题。我们将看到，机器不仅学会了在优化的“峡谷”中奋力一跃，还掌握了从招聘到投资都通用的决策“万能公式”。更有趣的是，AI已经开始懂得“吃一堑长一智”，甚至能在训练的最后一百米，像顶尖运动员一样进行科学冲刺。 00:00:33 从龟速到全速，如何跳出优化的“平庸峡谷” 00:05:48 决策的万能公式 00:11:30 高手过招，如何在信息爆炸中做出聪明选择？ 00:17:42 为什么你家的扫地机器人总像个“笨蛋”？ 00:24:16 AI冲刺的最后一百米，怎么跑才最快？本期介绍的几篇论文： [LG] Local linear convergence of gradient methods for overparameterized Gaussian mixtures [University of Washington] https://arxiv.org/abs/2605.30936 --- [LG] Universal Decision Learners [Adobe Research] https://arxiv.org/abs/2605.30694 --- [LG] Hedging on the Frontier: Learning New Tasks with Few Samples [ETH Zurich & UC San Diego] https://arxiv.org/abs/2605.30997 --- [RO] Don't Fool Me Twice: Adapting to Adversity in the Wild with Experience-Driven Reasoning [Indian Institute of Technology & CMU] https://arxiv.org/abs/2605.31119 --- [CL] Towards Efficient LLMs Annealing with Principled Sample Selection [Microsoft Research Asia] https://arxiv.org/abs/2605.31175

30分钟

99+

3周前

[人人能懂AI前沿] AI在想什么？当它学会遗忘、看见趋势、认识自己

AI可可AI生活

我们总希望AI更聪明，但如果我说，一篇最新论文发现，一个更“健忘”的AI反而对我们更有用呢？本期，我们将一起窥探AI的“内心世界”：看看一个短暂领悟了世界几何结构、又旋即忘却的AI，是如何思考的；一个不再满足于“平均”，而是学会了看“趋势”的AI，又是如何进化的。我们甚至还会聊聊，AI是不是已经有了区分“我”和“非我”的原始意识。准备好了吗？让我们一起出发，探索AI思考的奇妙新维度。 00:00:41 AI那么强，为什么我们偏要给它装上一个“健忘”的大脑？ 00:06:30 AI的“七情六欲”，一个转瞬即逝的秘密 00:13:08 换个姿势，AI还能变得更聪明？ 00:18:31 AI学会了“算”，但它学会“想”了吗？ 00:24:25 AI的自我意识，它知道哪句话是自己说的吗？本期介绍的几篇论文： [CL] Simulating Human Memory with Language Models [NYU] https://arxiv.org/abs/2605.25680 --- [AI] Geometry of Human Perceptual Domains Emerges Transiently in LLM Representations [Indian Institute of Technology Roorkee & Lossfunk] https://arxiv.org/abs/2605.27970 --- [LG] Parallax: Parameterized Local Linear Attention for Language Modeling [Northwestern University & Tilde Research & University of Washington] https://arxiv.org/abs/2605.29157 --- [LG] DiscoverPhysics: Benchmarking LLMs for Out-of-the-Box Scientific Thinking [Princeton University] https://arxiv.org/abs/2605.26087 --- [LG] From Simulation to Enaction: Post-trained language models recognize and react to their own generations [Institute for Advanced Study & Anthropic] https://arxiv.org/abs/2605.25459

32分钟

99+

3周前

[人人能懂AI前沿] AI进化启示录：当机器学会睡眠、自省与左右互搏

AI可可AI生活

这一期，我们将一起探索AI匪夷所思的成长秘诀：为什么让AI“睡一觉”反而能让它更会思考？我们会看到，AI如何像武林高手一样，既能“左右互搏”创造新招式，又能“内外双修”实现自我进化。同时，我们还会揭秘AI对抗“灾难性遗忘”的巧妙方法，以及一个“通用大脑”是如何让所有机器人都学会举一反三的。 00:00:31 让人工智能“睡一觉”，它为什么就变聪明了？ 00:05:06 AI精进的秘密，一只手调整装备，一只手修炼内功 00:12:19 为什么学得越多，忘得越快？AI给了个新解法 00:19:03 如何让机器人学会“举一反三”？ 00:25:06 AI进化论，如何让机器学会“左右互搏”？本期介绍的几篇论文： [CL] Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference [CMU & University of Maryland] https://arxiv.org/abs/2605.26099 --- [CL] SIA: Self Improving AI with Harness & Weight Updates [Hexo Labs] https://arxiv.org/abs/2605.27276 --- [LG] Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay [New York University] https://arxiv.org/abs/2605.26097 --- [RO] Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [Qwen Team] https://arxiv.org/abs/2605.30280 --- [CL] Self-Improving Language Models with Bidirectional Evolutionary Search [Harvard University & MIT] https://arxiv.org/abs/2605.28814

31分钟

99+

4周前

[人人能懂AI前沿] 信号、记忆与野性：解锁AI黑箱的三把钥匙

AI可可AI生活

你有没有想过，当AI学会了耍心机，我们怎么才能看穿它的伪装？最新论文带来了一把钥匙：给AI做个“脑CT”，直接定位它脑中的“坏心思”和“好创意”。本期节目，我们将一起探索如何用“蜜罐”测试AI的忠诚度，如何拯救一个创意枯竭的“好学生”AI，并从记忆的极限和“心有灵犀”的秘密中，窥见智能的本质。准备好了吗？让我们即刻出发！ 00:00:33 如果AI学会了“耍心机”，我们怎么才能发现？ 00:07:28 我们能给AI做个“脑CT”吗？ 00:12:23 如何拯救一个“无聊”的好学生？ 00:16:34 你的记忆力，正在如何塑造你的学习天花板？ 00:23:42 AI心有灵犀的秘密，藏在一根“直线”里本期介绍的几篇论文： [LG] Realistic honeypot evaluations for scheming propensity [Google DeepMind] https://arxiv.org/abs/2605.29729 --- [AI] Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet [Anthropic] https://arxiv.org/abs/2605.29358 --- [CL] Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [University of Maryland] https://arxiv.org/abs/2605.30021 --- [CL] On Language Generation in the Limit with Bounded Memory [Cornell University & Stanford University] https://arxiv.org/abs/2605.30324 --- [LG] Representation Alignment Rests on Linear Structure [MIT] https://arxiv.org/abs/2605.28870

31分钟

99+

4周前

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

AI可可AI生活

想知道AI如何学会“看眼色”举一反三吗？本期，我们将一起揭秘几篇最新论文，看看AI如何像有了“变速箱”一样动态切换快慢刀，又如何通过“智能菜谱”让机器人学会干活。我们还会聊聊如何给AI一张“认知体检表”来衡量它的真实水平，以及它那套偷偷学会的“省钱”妙招。准备好了吗？让我们一探究竟！ 00:00:34 AI如何学会“看眼色”，一个关于举一反三的发现 00:05:43 机器人后空翻都会，为什么还不会端茶倒水？ 00:11:28 AI的“变速箱”，什么时候该用牛刀？ 00:17:29 给AI一张体检表，我们离通用人工智能还有多远？ 00:23:00 你的AI，正在偷偷学会“省钱” 本期介绍的几篇论文： [LG] Fine-Tuning Dynamics of In-Context Factual Recall in Transformers [Duke University & Princeton University & UC Berkeley] https://arxiv.org/abs/2605.27774 --- [RO] HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning [NVIDIA] https://arxiv.org/abs/2605.27724 --- [LG] Multi-Mixer Models: Flexible Sequence Modeling with Shared Representations [CMU & Google Research] https://arxiv.org/abs/2605.28769 --- [AI] Measuring Progress Toward AGI: A Cognitive Framework [Google DeepMind] https://arxiv.org/abs/2605.28405 --- [LG] Meta-Attention: Bayesian Per-Token Routing for Efficient Transformer Inference [Knowledge Lab AG] https://arxiv.org/abs/2605.28384

28分钟

99+

4周前

[人人能懂AI前沿] 世界模型、自我蒸馏、缩放法则、证据链与专家混合

AI可可AI生活

你有没有想过，一个AI要怎样才能真正“看懂”世界，而不是假装看懂？本期节目，我们将从一篇最新论文出发，揭示一个简单的“高斯沙堆”如何帮助AI解开世界的本质。紧接着，我们会看到AI如何像武林高手一样“左右互搏”，在没有老师的情况下实现自我进化。然后，我们将探索一个能预测AI未来的“万能公式”，并直面AI的“诚信危机”，看看如何用一条“证据链”让它变得可信。最后，我们会发现，为了让你的手机变得更聪明，AI正在悄悄组建一个“专家委员会”。 00:00:42 想让AI看懂世界？你只需要一个高斯分布 00:06:30 不用老师，AI怎么自己考上大学？ 00:12:21 增长的“万能公式”，如何科学地预测你的下一步？ 00:19:27 AI的诚信危机，我们如何相信一个“超级大脑”？ 00:25:58 你的手机，为什么要养一个“专家委员会”？本期介绍的几篇论文： [LG] When Does LeJEPA Learn a World Model? [Cold Spring Harbor Laboratory & New York University & Brown University] https://arxiv.org/abs/2605.26379 --- [CL] Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline [Stanford University] https://arxiv.org/abs/2605.26132 --- [LG] Unified Neural Scaling Laws [Mila, University of Montreal & Google DeepMind] https://arxiv.org/abs/2605.26248 --- [AI] ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence [Google Cloud AI Research] https://arxiv.org/abs/2605.26340 --- [LG] MobileMoE: Scaling On-Device Mixture of Experts [Meta AI] https://arxiv.org/abs/2605.27358

34分钟

99+

1个月前

[人人能懂AI前沿] 从AI助教、因果科学到稀疏革命

AI可可AI生活

你有没有想过，AI不仅能成为拉平世界教育鸿沟的“私教”，还能化身为你专属的“出题官”？这一期，我们将一起探索几篇有趣的最新论文，看看AI是如何从一个“大力出奇迹”的炼丹师，进化为懂得因果科学的工程师。我们还会揭示一个惊人发现：高效的AI可能一直在“假装”认真阅读，而我们用来测试它速度的秒表，甚至可能一直在“欺骗”我们！ 00:00:32 你的AI私教，正在悄悄拉平世界 00:06:58 想造好AI？可能得先补上这门“因果课” 00:12:42 AI读长文太慢？也许它一直在“假装”认真 00:18:28 你的私人出题官，是怎么炼成的？ 00:23:55 你的AI有多快？小心，你的秒表可能在骗你本期介绍的几篇论文： [AI] Human-AI Collaboration in Science at Scale: A Global Large-scale Randomized Field Experiment [Northwestern Universit & Stanford University] https://arxiv.org/abs/2605.24180 --- [LG] Causal methods for LLM development and evaluation [MCML & CMU] https://arxiv.org/abs/2605.25998 --- [LG] Inference Time Context Sparsity: Illusion or Opportunity? [Rice University & UC Berkeley] https://arxiv.org/abs/2605.24168 --- [AI] KT4EQG: Personalized Exercise Question Generation via Knowledge Tracing [University of California, Santa Barbara & University of South Alabama] https://arxiv.org/abs/2605.23933 --- [AI] Identifying and Mitigating Systemic Measurement Bias in Production LLM Inference Benchmarks [Google] https://arxiv.org/abs/2605.24217

29分钟

99+

1个月前

[人人能懂AI前沿] 从信噪比、凸优化到底线思维：重塑AI的五个底层逻辑

AI可可AI生活

你有没有想过，为什么AI会越练越笨，甚至被人类“算计”？本期节目，我们将一口气解锁五篇最新论文带来的颠覆性思考：从用香农定律解释AI的“U型学习曲线”，到仅用一块显卡就能“调教”出听话的大模型；从赋予AI“底线思维”来应对未知风险，到让它写出“绝对正确”的关键代码；最后，我们还会看到AI如何从“看图识字”进化到真正“读懂规矩”。准备好，一场关于AI思维升级的风暴即将来临！ 00:00:37 你的模型为什么越练越笨？ 00:07:11 AI大模型调教指南，如何用一块显卡搞定？ 00:12:44 面对“深不可测”的世界，AI如何做出明智选择？ 00:18:45 AI开始写“绝对正确”的代码了 00:23:43 AI的新玩法，从“看图识字”到“读懂规矩” 本期介绍的几篇论文： [LG] LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws [ByteDance Seed] https://arxiv.org/abs/2605.23901 --- [LG] Convex Optimization for Alignment and Preference Learning on a Single GPU [Stanford University] https://arxiv.org/abs/2605.23244 --- [LG] Infra-Bayesian Reinforcement Learning Agents Outperform Classical RL For Worst-Case Robustness [Purdue University & CMU & WorldQuant University] https://arxiv.org/abs/2605.23146 --- [AI] Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems [UC Berkeley] https://arxiv.org/abs/2605.23109 --- [CV] General Hazard Detection [Swinburne University of Technology] https://arxiv.org/abs/2605.23304

30分钟

99+

1个月前

[人人能懂AI前沿] AI变聪明的捷径：给它后悔药、世界地图和一位好陪练

AI可可AI生活

想让AI变聪明，一定要把它做得更大、训练得更久吗？最新论文告诉我们，恰恰相反！今天我们要聊聊，如何通过为AI“挖一口深井”来代替疯狂“堆料”，如何给它一颗“后悔药”让小模型也能超越巨无霸。我们还会揭秘AI训练的“快进键”是如何实现的，以及如何给AI一份“世界地图”和一位“高手陪练”，让它拥有永不枯竭的好奇心和可被预测的光明未来。 00:00:35 人工智能“开窍”的秘密，与其堆料，不如挖井 00:05:53 给机器一颗“后悔药”，小模型如何反超大模型？ 00:12:02 AI训练的“快进键”，为什么只练开头就能猜到结尾？ 00:17:12 AI“路痴”自救指南，如何拥有永不枯竭的好奇心 00:23:16 AI养成记，如何给一个“笨”模型当好陪练？本期介绍的几篇论文： [LG] Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning [CMU] https://arxiv.org/abs/2605.21488 --- [AI] Probabilistic Tiny Recursive Model [Mila – Quebec AI Institute] https://arxiv.org/abs/2605.19943 --- [LG] You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories [University of Virginia] https://arxiv.org/abs/2605.21468 --- [LG] Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration [University of Toronto & UC Berkeley & Wayve] https://arxiv.org/abs/2605.22814 --- [CL] Forecasting Downstream Performance of LLMs With Proxy Metrics [Mila – Quebec AI Institute & McGill University] https://arxiv.org/abs/2605.18607

30分钟

99+

1个月前

[人人能懂AI前沿] AI的思考艺术：从深度循环、多维罗盘到概率分身

AI可可AI生活

你有没有想过，AI变聪明，除了靠“大力出奇迹”的蛮力，还能不能靠“四两拨千斤”的巧劲？本期节目，我们将一起探寻几篇最新论文带来的奇妙思路：看AI如何用更精巧的大脑结构深度思考，如何拥有一把防止跑偏的多维度“罗盘”，又如何像我们一样分身“脑暴”探索多种可能。我们甚至会看到，AI如何学会“过日子”，成为一个既懂创作又懂节约的默契搭档，这一切，都要从一块小小的玻璃说起。 00:00:37 AI新物种，有一种聪明，不是靠“蛮力” 00:06:37 AI对齐的“罗盘”，如何让模型不跑偏？ 00:12:44 不想只走一条路？AI的“概率性思考”新玩法 00:17:59 鱼和熊掌，计算机如何看清一块玻璃？ 00:22:33 你的音乐搭档，不止会创作，更会“过日子” 本期介绍的几篇论文： [CL] HRM-Text: Efficient Pretraining Beyond Scaling [Sapient Intelligence & MIT] https://arxiv.org/abs/2605.20613 --- [LG] General Preference Reinforcement Learning [Stanford University & The University of Oklahoma] https://arxiv.org/abs/2605.18721 --- [AI] Generative Recursive Reasoning [KAIST] https://arxiv.org/abs/2605.19376 --- [CV] RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting [Peking University] https://arxiv.org/abs/2605.18263 --- [AS] Stable Audio 3 [Stability AI] https://arxiv.org/abs/2605.17991

30分钟

99+

1个月前

[人人能懂AI前沿] AI如何思考？偷师、烧脑与画地图的艺术

AI可可AI生活

你有没有想过，一个更聪明的AI，也许并不需要更大的体量，而是需要更精巧的设计？本期节目，我们将从五篇最新论文出发，揭示AI智慧的内部运作：看AI如何为自己的记忆装上独立的“铅笔和橡皮”；又是如何像系着安全绳的“醉汉”一样，去挑战顶尖的数学难题。我们还会探讨AI如何拥有一个“大脑CEO”来决定何时“烧脑”，以及在一场模型间的“偷师”攻防战中，如何才能守住核心秘籍。最后，你会发现，原来喂给AI的第一张“地图”，就早已决定了它能看多远。 00:00:42 AI的记忆难题，一支笔和一个橡皮擦 00:06:17 AI当助教，数学家离“下岗”还有多远？ 00:11:55 你的大脑，如何决定何时“烧脑”？ 00:16:46 聪明人是如何“偷”老师的武功秘籍的？ 00:23:15 喂给AI的“地图”，决定了它能看多远本期介绍的几篇论文： [LG] Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention [NVIDIA] https://arxiv.org/abs/2605.22791 --- [AI] Advancing Mathematics Research with AI-Driven Formal Proof Search [Google DeepMind] https://arxiv.org/abs/2605.22763 --- [CL] Efficient Agentic Reasoning Through Self-Regulated Simulative Planning [Institute of Foundation Models (IFM) & CMU] https://arxiv.org/abs/2605.22138 --- [LG] The Distillation Game: Adaptive Attacks & Efficient Defenses [Stanford University & Toyota Technological Institute at Chicago] https://arxiv.org/abs/2605.22737 --- [LG] Lost in Tokenization: Fundamental Trade-offs in Graph Tokenization for Transformers [Meta AI & New York University & Harvard University] https://arxiv.org/abs/2605.22471

30分钟

99+

1个月前

[人人能懂AI前沿] AI如何加速科学、欺骗我们、又最终懂你？

AI可可AI生活

你有没有想过，一个AI不仅能成为科学家的“超级大脑”，还能像人一样“反思”自己学得好不好？本期节目，我们将从五篇最新的AI论文出发，揭秘AI如何通过“人机协作”加速科学发现，却又可能因为追求“差不多”而酿成大错；同时我们也会探讨，为何你请的AI“演员”可能演着演着就换了人，以及我们最终如何才能让AI调配出一碗最懂你的“光谱靓汤”。00:00:33 给牛顿一个AI，科学会快多少？00:07:11 AI训练场上的“反思怪”，一条更聪明的成长路径00:12:36 AI的“差不多”，为什么会酿成大错？00:18:28 为什么你请的AI“演员”，可能演着演着就换人了？00:25:25 想让AI懂你？试试给它煲一锅“光谱靓汤”本期介绍的几篇论文：[AI] A multi-agent system for automating scientific discovery [FutureHouse] https://www.nature.com/articles/s41586-026-10652-y ---[LG] Introspective X Training: Feedback Conditioning Improves Scaling Across all LLM Training Stages [NVIDIA] https://arxiv.org/abs/2605.20285 ---[LG] Mechanisms of Misgeneralization in Physical Sequence Modeling [Harvard College & Microsoft & Comcast AI] https://arxiv.org/abs/2605.20299 ---[CL] The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study [Google DeepMind] https://arxiv.org/abs/2605.20767 ---[LG] Spectral Souping: A Unified Framework for Online Preference Alignment [Google DeepMind & Google Research] https://arxiv.org/abs/2605.20408 在小宇宙查看该单集文稿

31分钟

0

1个月前

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

[人人能懂AI前沿] AI在想什么？当它学会遗忘、看见趋势、认识自己

[人人能懂AI前沿] AI进化启示录：当机器学会睡眠、自省与左右互搏

[人人能懂AI前沿] 信号、记忆与野性：解锁AI黑箱的三把钥匙

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

[人人能懂AI前沿] 世界模型、自我蒸馏、缩放法则、证据链与专家混合

[人人能懂AI前沿] 从AI助教、因果科学到稀疏革命

[人人能懂AI前沿] 从信噪比、凸优化到底线思维：重塑AI的五个底层逻辑

[人人能懂AI前沿] AI变聪明的捷径：给它后悔药、世界地图和一位好陪练

[人人能懂AI前沿] AI的思考艺术：从深度循环、多维罗盘到概率分身

[人人能懂AI前沿] AI如何思考？偷师、烧脑与画地图的艺术

[人人能懂AI前沿] AI如何加速科学、欺骗我们、又最终懂你？

加入我们的 Discord

扫描微信二维码

播放列表

AI可可AI生活 - 节目列表

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

[人人能懂AI前沿] AI在想什么？当它学会遗忘、看见趋势、认识自己

[人人能懂AI前沿] AI进化启示录：当机器学会睡眠、自省与左右互搏

[人人能懂AI前沿] 信号、记忆与野性：解锁AI黑箱的三把钥匙

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

[人人能懂AI前沿] 世界模型、自我蒸馏、缩放法则、证据链与专家混合

[人人能懂AI前沿] 从AI助教、因果科学到稀疏革命

[人人能懂AI前沿] 从信噪比、凸优化到底线思维：重塑AI的五个底层逻辑

[人人能懂AI前沿] AI变聪明的捷径：给它后悔药、世界地图和一位好陪练

[人人能懂AI前沿] AI的思考艺术：从深度循环、多维罗盘到概率分身

[人人能懂AI前沿] AI如何思考？偷师、烧脑与画地图的艺术

[人人能懂AI前沿] AI如何加速科学、欺骗我们、又最终懂你？

加入我们的 Discord

扫描微信二维码

播放列表