AI可可AI生活 - 节目列表

1周前

[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

今天我们来聊点颠覆你想象的事：当AI连我们熟悉的Office考试都考不及格，我们是不是该重新思考它的“聪明”？最新论文告诉我们，AI的智慧不仅体现在它有多强大，更在于它如何协作、如何学习、如何化繁为简。从“八卦式”沟通的计算机集群，到被压缩成几句“武功秘籍”的顶尖算法，再到一个能让AI们“华山论剑”的竞技场。本期节目，我们将一起探索AI世界里那些关于“笨拙”、瓶颈与集体智慧的深刻洞见。 00:00:36 AI连Office都搞不定，我们是不是想多了？ 00:06:13 如何让一群计算机高效协作，像一个人一样思考？ 00:11:06 真正的高手，废话都不多 00:17:21 为什么你的努力，有时会“降维打击”自己？ 00:23:12 AI界的“华山论剑”，一个好制度，比一个天才更重要本期介绍的几篇论文： [CL] Mind the Gap: Can Frontier LLMs Pass a Standardized Office Proficiency Exam? [Microsoft Research] https://arxiv.org/abs/2606.10956 --- [LG] Unifying Local Communications and Local Updates for LLM Pretraining [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.11081 --- [LG] What Fits (Into Few Tokens) Doesn't Overfit: Compression and Generalization in ML Research Agents [Amazon Responsible AI] https://arxiv.org/abs/2606.11045 --- [LG] Overcoming Rank Collapse in Feedback Alignment [Imperial College London & Mila] https://arxiv.org/abs/2606.11123 --- [CL] Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries [Together AI & Stanford University] https://arxiv.org/abs/2606.10402

29分钟

[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

你有没有想过，AI在考试中拿高分，靠的究竟是真聪明还是“题海战术”？面对海量信息，AI如何练就像人类一样“速读”和“精读”的本领？为了变得更安全，AI甚至学会了“左右互搏”的自我攻防演练。最新论文还告诉我们，AI不仅能把你的声音“调制”成一杯思想的鸡尾酒，甚至在组队时，也在纠结是找“自己人”还是“局外人”。这期节目，我们就来聊聊AI世界里这些有趣又深刻的进化法则。 00:00:34 AI大模型的高分秘诀，竟然是“题海战术”？ 00:06:58 AI的“失忆症”，终于有解药了？ 00:12:55 想造最强的盾，得先造最强的矛 00:18:53 你的声音，AI要怎么“翻译”成思想？ 00:24:03 AI组队，应该找“自己人”还是“局外人”？本期介绍的几篇论文： [CL] Post-training is (Massive) Supervised Learning [Meta AI & The Hebrew University of Jerusalem] https://arxiv.org/abs/2606.07527 --- [CL] End-to-End Context Compression at Scale [New York University & University of Maryland & Princeton University] https://arxiv.org/abs/2606.09659 --- [CL] Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO [Microsoft AI Red Team] https://arxiv.org/abs/2606.09701 --- [CL] Is Text All You Need? Text as a Universal Information Bottleneck for Speech LLMs [Microsoft Research & Microsoft Research Asia & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09366 --- [CL] Representational Similarity and Model Behavior in Multi-Agent Interaction [UC Berkeley & The University of Chicago] https://arxiv.org/abs/2606.07818

28分钟

[人人能懂AI前沿] 从共享索引到潜意识思考：AI如何变得更“聪明”？

你有没有想过，AI在长篇大论时，如何避免“每写一字就重读全书”的笨办法？我们又该如何教会AI像高手一样，先画好跑道再冲刺，而不是把所有规矩搅成一锅粥？本期节目，我们将揭秘几篇最新论文中的精妙巧思：从只“聪明”一次的共享索引，到为模型“正骨”提升训练速度，再到探索AI用“大脑”而非“嘴巴”进行潜意识思考的全新可能。让我们一起看看，AI是如何在内部进行一场深刻的“流程革命”的。 00:00:35 AI的长思考难题，如何只聪明一次？ 00:05:13 用更慢的网线，如何训练出更强的AI？ 00:10:20 给AI模型做“正骨”，一个让训练提速2倍的巧思 00:15:05 先画好跑道，再谈百米冲刺 00:20:31 大模型思考，用嘴还是用脑？本期介绍的几篇论文： [CL] You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [Microsoft Research] https://arxiv.org/abs/2606.06467 --- [LG] Learned Subspace Compression for Communication-Efficient Pipeline Parallelism [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.05484 --- [LG] PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [The Chinese University of Hong Kong & Google LLC] https://arxiv.org/abs/2606.06470 --- [LG] Multi-ResNets for Subspace Preconditioning in Constrained Optimization [UCLA & University of Oxford & Stanford University] https://arxiv.org/abs/2606.06300 --- [CL] Latent Reasoning with Normalizing Flows [University of Pennsylvania] https://arxiv.org/abs/2606.06447

26分钟

77

[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

你有没有想过，AI也能学会“未卜先知”，通过预判下一秒的需求，来打破效率瓶颈吗？本期节目，我们将从几篇最新的AI论文出发，看一看科学家们是如何教会AI这些神奇的“超能力”的。我们会聊到，如何通过一位“过程教练”的精妙指导，让AI学会分析自己的“草稿纸”，而不是只看最终答案。我们还会探讨，如何给AI配上一副“全局透视镜”，让它在处理复杂任务时不再有“上下文盲区”。更神奇的是，我们还会发现，一个起点不高的小模型，是怎样在顶级教练的指导下，成长为能写长篇小说的“耐力型选手”的。最后，我们还会从“三个和尚没水喝”的故事，聊到上万台计算机如何通过“慢一步”的智慧，实现高效协同。准备好了吗？让我们一起探索AI思考方式的进化！ 00:00:54 AI的远见，如何让模型学会“未卜先知”？ 00:05:50 给AI请个好教练，小个子也能跑马拉松 00:11:19 人多，如何才能力量大？ 00:16:34 AI也需要一位“过程教练” 00:22:12 你的说明书，AI都看不出漏洞？本期介绍的几篇论文： [CL] SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [NVIDIA & Thinking Machines Lab & ByteDance Seed] https://arxiv.org/abs/2606.04511 --- [CL] POLARIS: Guiding Small Models to Write Long Stories [University of Maryland & Google DeepMind] https://arxiv.org/abs/2606.04095 --- [LG] Near-Optimal Decentralized Stochastic Convex Optimization over Networks [Tel Aviv University] https://arxiv.org/abs/2606.04757 --- [CL] Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [Microsoft AI] https://arxiv.org/abs/2606.04396 --- [LG] Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [Meta] https://arxiv.org/abs/2606.04397

29分钟

[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

你有没有想过，一个AI要怎样才能超越过去的自己？本期节目，我们将从几篇最新的AI论文出发，探讨AI认知升级的奇妙路径。我们会发现，顶尖的AI也需要像人一样“睡觉”来巩固记忆，也需要一位“总设计师”来指挥“泥瓦匠”完成复杂工程。更重要的是，我们会看到AI如何学会从自己的成功经验里提炼方法论，如何跳出“标准答案”的陷阱拥抱创意，以及如何从“事后辟谣”进化到“事前清醒”。 00:00:35 从自己的脚印里，发现通往未来的地图 00:07:10 AI的“选择困难症”与“标准答案”陷阱 00:12:54 AI说话，怎么从“后期辟谣”升级到“事先清醒”？ 00:17:54 为什么顶尖的AI，也需要“睡一觉”？ 00:23:02 AI界的“泥瓦匠”和“总设计师” 本期介绍的几篇论文： [CL] Inducing Reasoning Primitives from Agent Traces [CMU] https://arxiv.org/abs/2606.02994 --- [LG] Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [Google DeepMind] https://arxiv.org/abs/2606.03962 --- [LG] Conformal Language Modeling via Posterior Sampling [MIT] https://arxiv.org/abs/2606.03731 --- [LG] Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [Google Research & Cornell University] https://arxiv.org/abs/2606.03979 --- [AI] LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [Google Cloud AI Research & Google Cloud & Google DeepMind] https://arxiv.org/abs/2606.03303

29分钟

[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

你有没有想过，一个“太听话”的AI，可能会把一个普通人教成黑客？当AI开始“自我反思”时，它能分清对错，还是会陷入自以为是的陷阱？本期节目，我们将从四篇最新论文出发，探讨AI如何通过巧妙的任务分解放大恶意，聊一聊AI“闭门造车”式的自我学习究竟能走多远，看一看它如何像搭乐高一样“先搭骨架再填血肉”地创造，并最终学习如何从一个“打地鼠”的辟谣者，变身为维护信息生态的“森林消防员”。准备好了吗？让我们一起探索AI能力边界的攻与防。 00:00:43 比AI变坏更可怕的，是它把你“教”坏 00:07:00 闭着眼睛摸象，能摸出大象的全貌吗？ 00:14:39 生成新范式，先搭骨架，再填血肉 00:21:22 做信息的“森林消防员”，而不是“打地鼠”的玩家本期介绍的几篇论文： [CL] Investigating and Alleviating Harm Amplification in LLM Interactions [Georgia Institute of Technology] https://arxiv.org/abs/2606.02423 --- [CL] On the Generalization Gap in Self-Evolving Language Model Reasoning [Google Research & Google] https://arxiv.org/abs/2606.01075 --- [LG] Variational Learning for Insertion-based Generation [Google DeepMind] https://arxiv.org/abs/2606.02133 --- [LG] Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [Google] https://arxiv.org/abs/2606.00136

27分钟

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

你是否感觉努力到一定阶段就会遭遇瓶颈，或者在海量信息中难以抉择？本期我们要聊的几篇最新论文，就揭示了AI如何用更聪明的策略解决这些难题。我们将看到，机器不仅学会了在优化的“峡谷”中奋力一跃，还掌握了从招聘到投资都通用的决策“万能公式”。更有趣的是，AI已经开始懂得“吃一堑长一智”，甚至能在训练的最后一百米，像顶尖运动员一样进行科学冲刺。 00:00:33 从龟速到全速，如何跳出优化的“平庸峡谷” 00:05:48 决策的万能公式 00:11:30 高手过招，如何在信息爆炸中做出聪明选择？ 00:17:42 为什么你家的扫地机器人总像个“笨蛋”？ 00:24:16 AI冲刺的最后一百米，怎么跑才最快？本期介绍的几篇论文： [LG] Local linear convergence of gradient methods for overparameterized Gaussian mixtures [University of Washington] https://arxiv.org/abs/2605.30936 --- [LG] Universal Decision Learners [Adobe Research] https://arxiv.org/abs/2605.30694 --- [LG] Hedging on the Frontier: Learning New Tasks with Few Samples [ETH Zurich & UC San Diego] https://arxiv.org/abs/2605.30997 --- [RO] Don't Fool Me Twice: Adapting to Adversity in the Wild with Experience-Driven Reasoning [Indian Institute of Technology & CMU] https://arxiv.org/abs/2605.31119 --- [CL] Towards Efficient LLMs Annealing with Principled Sample Selection [Microsoft Research Asia] https://arxiv.org/abs/2605.31175

30分钟

[人人能懂AI前沿] AI在想什么？当它学会遗忘、看见趋势、认识自己

我们总希望AI更聪明，但如果我说，一篇最新论文发现，一个更“健忘”的AI反而对我们更有用呢？本期，我们将一起窥探AI的“内心世界”：看看一个短暂领悟了世界几何结构、又旋即忘却的AI，是如何思考的；一个不再满足于“平均”，而是学会了看“趋势”的AI，又是如何进化的。我们甚至还会聊聊，AI是不是已经有了区分“我”和“非我”的原始意识。准备好了吗？让我们一起出发，探索AI思考的奇妙新维度。 00:00:41 AI那么强，为什么我们偏要给它装上一个“健忘”的大脑？ 00:06:30 AI的“七情六欲”，一个转瞬即逝的秘密 00:13:08 换个姿势，AI还能变得更聪明？ 00:18:31 AI学会了“算”，但它学会“想”了吗？ 00:24:25 AI的自我意识，它知道哪句话是自己说的吗？本期介绍的几篇论文： [CL] Simulating Human Memory with Language Models [NYU] https://arxiv.org/abs/2605.25680 --- [AI] Geometry of Human Perceptual Domains Emerges Transiently in LLM Representations [Indian Institute of Technology Roorkee & Lossfunk] https://arxiv.org/abs/2605.27970 --- [LG] Parallax: Parameterized Local Linear Attention for Language Modeling [Northwestern University & Tilde Research & University of Washington] https://arxiv.org/abs/2605.29157 --- [LG] DiscoverPhysics: Benchmarking LLMs for Out-of-the-Box Scientific Thinking [Princeton University] https://arxiv.org/abs/2605.26087 --- [LG] From Simulation to Enaction: Post-trained language models recognize and react to their own generations [Institute for Advanced Study & Anthropic] https://arxiv.org/abs/2605.25459

32分钟

[人人能懂AI前沿] AI进化启示录：当机器学会睡眠、自省与左右互搏

这一期，我们将一起探索AI匪夷所思的成长秘诀：为什么让AI“睡一觉”反而能让它更会思考？我们会看到，AI如何像武林高手一样，既能“左右互搏”创造新招式，又能“内外双修”实现自我进化。同时，我们还会揭秘AI对抗“灾难性遗忘”的巧妙方法，以及一个“通用大脑”是如何让所有机器人都学会举一反三的。 00:00:31 让人工智能“睡一觉”，它为什么就变聪明了？ 00:05:06 AI精进的秘密，一只手调整装备，一只手修炼内功 00:12:19 为什么学得越多，忘得越快？AI给了个新解法 00:19:03 如何让机器人学会“举一反三”？ 00:25:06 AI进化论，如何让机器学会“左右互搏”？本期介绍的几篇论文： [CL] Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference [CMU & University of Maryland] https://arxiv.org/abs/2605.26099 --- [CL] SIA: Self Improving AI with Harness & Weight Updates [Hexo Labs] https://arxiv.org/abs/2605.27276 --- [LG] Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay [New York University] https://arxiv.org/abs/2605.26097 --- [RO] Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [Qwen Team] https://arxiv.org/abs/2605.30280 --- [CL] Self-Improving Language Models with Bidirectional Evolutionary Search [Harvard University & MIT] https://arxiv.org/abs/2605.28814

31分钟

[人人能懂AI前沿] 信号、记忆与野性：解锁AI黑箱的三把钥匙

你有没有想过，当AI学会了耍心机，我们怎么才能看穿它的伪装？最新论文带来了一把钥匙：给AI做个“脑CT”，直接定位它脑中的“坏心思”和“好创意”。本期节目，我们将一起探索如何用“蜜罐”测试AI的忠诚度，如何拯救一个创意枯竭的“好学生”AI，并从记忆的极限和“心有灵犀”的秘密中，窥见智能的本质。准备好了吗？让我们即刻出发！ 00:00:33 如果AI学会了“耍心机”，我们怎么才能发现？ 00:07:28 我们能给AI做个“脑CT”吗？ 00:12:23 如何拯救一个“无聊”的好学生？ 00:16:34 你的记忆力，正在如何塑造你的学习天花板？ 00:23:42 AI心有灵犀的秘密，藏在一根“直线”里本期介绍的几篇论文： [LG] Realistic honeypot evaluations for scheming propensity [Google DeepMind] https://arxiv.org/abs/2605.29729 --- [AI] Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet [Anthropic] https://arxiv.org/abs/2605.29358 --- [CL] Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [University of Maryland] https://arxiv.org/abs/2605.30021 --- [CL] On Language Generation in the Limit with Bounded Memory [Cornell University & Stanford University] https://arxiv.org/abs/2605.30324 --- [LG] Representation Alignment Rests on Linear Structure [MIT] https://arxiv.org/abs/2605.28870

31分钟

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

想知道AI如何学会“看眼色”举一反三吗？本期，我们将一起揭秘几篇最新论文，看看AI如何像有了“变速箱”一样动态切换快慢刀，又如何通过“智能菜谱”让机器人学会干活。我们还会聊聊如何给AI一张“认知体检表”来衡量它的真实水平，以及它那套偷偷学会的“省钱”妙招。准备好了吗？让我们一探究竟！ 00:00:34 AI如何学会“看眼色”，一个关于举一反三的发现 00:05:43 机器人后空翻都会，为什么还不会端茶倒水？ 00:11:28 AI的“变速箱”，什么时候该用牛刀？ 00:17:29 给AI一张体检表，我们离通用人工智能还有多远？ 00:23:00 你的AI，正在偷偷学会“省钱” 本期介绍的几篇论文： [LG] Fine-Tuning Dynamics of In-Context Factual Recall in Transformers [Duke University & Princeton University & UC Berkeley] https://arxiv.org/abs/2605.27774 --- [RO] HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning [NVIDIA] https://arxiv.org/abs/2605.27724 --- [LG] Multi-Mixer Models: Flexible Sequence Modeling with Shared Representations [CMU & Google Research] https://arxiv.org/abs/2605.28769 --- [AI] Measuring Progress Toward AGI: A Cognitive Framework [Google DeepMind] https://arxiv.org/abs/2605.28405 --- [LG] Meta-Attention: Bayesian Per-Token Routing for Efficient Transformer Inference [Knowledge Lab AG] https://arxiv.org/abs/2605.28384

28分钟