AI可可AI生活 - 节目列表

1周前

[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

你有没有想过，我们如何给AI这头“吞金兽”来一次彻底的瘦身和压缩？如何为它设计一张分工明确的“组织架构图”，让“调度员”和“专家”各司其职？我们又该如何给它装上一个既能规避灾难性风险，又能动态调整预算的“安全大脑”？当AI自己当上“裁判”时，我们如何确保它不是在抛硬币？本期节目，我们将通过几篇最新的研究，一起探索如何让AI变得更高效、更聪明，也更可靠。 00:00:31 驯服AI的新兵法，“共享”与“压缩” 00:06:36 给AI画一张“组织架构图”，谁是调度员，谁是专家？ 00:13:07 如何让AI既能干，又不出事？ 00:18:11 AI当裁判，是明察秋毫，还是抛硬币？ 00:23:49 给AI上好“紧箍咒”，它才能学得又快又稳本期介绍的几篇论文： [LG] Gefen: Optimized Stochastic Optimizer [Reichman University & Tel Aviv University] https://arxiv.org/abs/2606.13894 --- [LG] A theoretical model for task routing in mixture-of-expert transformers [University of Sydney & Zhejiang University] https://arxiv.org/abs/2606.14398 --- [LG] Utility-Constrained Policy Optimization [York University & Google DeepMind] https://arxiv.org/abs/2606.14029 --- [CL] The Coin Flip Judge? Reliability and Bias in LLM-as-a-Judge Evaluation [A Yagubyan] https://arxiv.org/abs/2606.13685 --- [LG] Diffusion Policy Optimization without Drifting Apart [UC Berkeley] https://arxiv.org/abs/2606.13795

30分钟

1周前

[人人能懂AI前沿] AI的成长三部曲：学会约束、学会思考、学会记忆

如果AI像个学生，我们该如何教育它？本期节目，我们将一起探索几篇最新论文带来的惊人答案：我们将看到，如何用一根充满智慧的“弹力绳”防止AI“学疯了”；如何用一棵“假设树”教会AI像科学家一样累积经验；我们还会举办一场AI记忆力大赛，看看究竟是“死记硬背”还是“内在结构”更胜一筹；最后，我们将揭示一种让AI“开卷的我”去教“闭卷的我”的神奇训练法，并学会如何像外科医生一样，为AI精准“切除”坏习惯。准备好了吗？让我们一起看看，人类是如何教会AI“学习如何学习”的。 00:00:42 AI“学疯了”怎么办？一根“弹力绳”的智慧 00:06:42 如何让AI像科学家一样思考？ 00:13:26 你的记忆，是“看过”还是“记住”了？ 00:19:22 AI训练的新思路，优等生是如何“开卷”带“闭卷”的？ 00:25:10 我们给AI的“好评”，正在让它变“笨”吗？本期介绍的几篇论文： [LG] Rethinking the Divergence Regularization in LLM RL [Tencent Hunyuan & NUS] https://arxiv.org/abs/2606.09821 --- [CL] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement [Microsoft Research & Renmin University of China] https://arxiv.org/abs/2606.11926 --- [CV] Echo-Memory: A Controlled Study of Memory in Action World Models [The University of Hong Kong & Joy Future Academy, JD & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09803 --- [LG] Rubric-Guided Self-Distillation: Post-Training Without Rubric Verifiers [Scale AI] https://arxiv.org/abs/2606.12507 --- [LG] Anatomy of Post-Training: Using Interpretability to Characterize Data and Shape the Learning Signal [GOODFIRE] https://arxiv.org/abs/2606.12360

32分钟

[人人能懂AI前沿] 给AI装上“第六感”：从感知、记忆到协作的全面升级

你有没有想过，未来的AI不再只是一个“大力士”，而是一个善用巧劲的“策略家”？本期节目，我们将一起探寻几篇最新论文，看看AI如何学会像我们一样“抓重点”来读懂万字长文，又如何通过一个“共享白板”实现高效团队协作。我们还会揭秘，AI怎样无中生有地获得“第六感”，如何靠着一本“记忆草稿本”创作出不会失忆的长视频，以及它又是怎样得到一支“魔法棒”，能对你的文章进行外科手术般的精准修改。准备好了吗？让我们一起看看AI是如何变聪明的！ 00:00:39 你的手机，是怎么“偷懒”变聪明的？ 00:05:03 人多不一定力量大，但“会开会”的团队可以 00:11:33 给机器装上“第六感”，一种更聪明的学习方式 00:18:02 AI做长视频，怎样才能不“失忆”？ 00:23:18 给AI一支“局部修改”的魔法棒本期介绍的几篇论文： [LG] MiniMax Sparse Attention: MiniMax is a surprisingly effective reward for instruction following [MiniMax] https://arxiv.org/abs/2606.13392 --- [LG] Decentralized Multi-Agent Systems with Shared Context: Decentralized Multi-Agent Systems with Shared Context [Stanford University] https://arxiv.org/abs/2606.10662 --- [RO] FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning [CMU] https://arxiv.org/abs/2606.12406 --- [CV] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation: MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation [MIT & Toyota Research Institute] https://arxiv.org/abs/2606.09056 --- [CL] TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering: TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering [MBZUAI] https://arxiv.org/abs/2606.08408

[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

你有没有想过，当AI变得比我们更聪明时，它会是什么样子？我们又该如何为五花八门的AI办一场公平的“奥运会”？本期节目，我们将一起探索通往超级智能的四条可能路径，看看科学家们如何将“炼丹”般的AI调参过程，变成“看图施工”的科学方法。我们还会揭秘一种让AI画画速度更快、质量不变的“师徒协作”新技巧，并最终探讨一个深刻的问题：当我们向AI寻求人生建议时，它究竟是智慧的“诸葛亮”，还是只想讨好你的“马屁精”？ 00:00:36 AI的下一站，以及通往未来的四条路 00:06:20 如何给AI办一场公平的“奥运会”？ 00:11:43 AI调参，从“炼丹玄学”到“看图施工” 00:16:30 AI画画慢？一种“组团验收”的加速心法 00:24:05 如何判断你的AI顾问，是“诸葛亮”还是“马屁精”？本期介绍的几篇论文： [AI] From AGI to ASI [Google DeepMind] https://arxiv.org/abs/2606.12683 --- [AI] AgentBeats: Agentifying Agent Assessment for Openness, Standardization, and Reproducibility [UC Berkeley & University of California, Santa Cruz] https://arxiv.org/abs/2606.13608 --- [LG] LoRA-Muon: Spectral Steepest Descent on the Low-Rank Manifold [EleutherAI] https://arxiv.org/abs/2606.12921 --- [LG] Accelerating Speculative Diffusions via Block Verification [Google Research & Google DeepMind] https://arxiv.org/abs/2606.13426 --- [LG] Normative Robustness as a Frontier for Non-Verifiable Reasoning in LLMs [Google DeepMind & Imperial College London] https://arxiv.org/abs/2606.12731

30分钟

[人人能懂AI前沿] AI的自我审问、私人顾问与隐秘族谱

你有没有想过，我们不给标准答案，只靠“交叉盘问”就能把AI训练成逻辑高手？最新论文告诉我们，答案是可以的。本期节目，我们将一起探索AI世界里那些令人拍案叫绝的新思路：看AI如何通过“自我审问”学会空间推理，如何化身“私人顾问”为你量身打造推荐，又如何借助“几何导航”解决超复杂的匹配难题。我们还会化身AI侦探，揭开模型背后那张“隐秘族谱”的秘密，并一窥科学家们如何给AI上“脑补课”，让它学着像人脑一样思考。准备好了吗？让我们即刻出发！ 00:00:41 如何不靠“标准答案”，把AI训练成“明白人”？ 00:05:27 推荐系统怎么“猜”你，以及怎么“猜”得更好？ 00:11:11 你的导航升级了吗？从“看脚下”到“看地图” 00:16:53 AI模型的“隐秘族谱”，你用的模型，到底是谁生的？ 00:23:30 给AI上堂“脑补课”，它能学会像人一样思考吗？本期介绍的几篇论文： [LG] The Art of Interrogation: Consistency Amplifies Factuality in Spatial Reasoning [Google] https://arxiv.org/abs/2606.11918 --- [IR] LLM-Based User Personas for Recommendations at Scale [Google Deepmind & Google] https://arxiv.org/abs/2606.12198 --- [LG] A Riemannian Approach to Low-Rank Optimal Transport [IIT Bombay & Microsoft India] https://arxiv.org/abs/2606.12120 --- [CL] Which Models Are Our Models Built On? Auditing Invisible Dependencies in Modern LLMs [UC Berkeley] https://arxiv.org/abs/2606.12385 --- [LG] Beyond representational alignment with brain-guided language models for robust reasoning [Peking University & Tsinghua University] https://arxiv.org/abs/2606.11893

28分钟

[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

今天我们来聊点颠覆你想象的事：当AI连我们熟悉的Office考试都考不及格，我们是不是该重新思考它的“聪明”？最新论文告诉我们，AI的智慧不仅体现在它有多强大，更在于它如何协作、如何学习、如何化繁为简。从“八卦式”沟通的计算机集群，到被压缩成几句“武功秘籍”的顶尖算法，再到一个能让AI们“华山论剑”的竞技场。本期节目，我们将一起探索AI世界里那些关于“笨拙”、瓶颈与集体智慧的深刻洞见。 00:00:36 AI连Office都搞不定，我们是不是想多了？ 00:06:13 如何让一群计算机高效协作，像一个人一样思考？ 00:11:06 真正的高手，废话都不多 00:17:21 为什么你的努力，有时会“降维打击”自己？ 00:23:12 AI界的“华山论剑”，一个好制度，比一个天才更重要本期介绍的几篇论文： [CL] Mind the Gap: Can Frontier LLMs Pass a Standardized Office Proficiency Exam? [Microsoft Research] https://arxiv.org/abs/2606.10956 --- [LG] Unifying Local Communications and Local Updates for LLM Pretraining [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.11081 --- [LG] What Fits (Into Few Tokens) Doesn't Overfit: Compression and Generalization in ML Research Agents [Amazon Responsible AI] https://arxiv.org/abs/2606.11045 --- [LG] Overcoming Rank Collapse in Feedback Alignment [Imperial College London & Mila] https://arxiv.org/abs/2606.11123 --- [CL] Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries [Together AI & Stanford University] https://arxiv.org/abs/2606.10402

[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

你有没有想过，AI在考试中拿高分，靠的究竟是真聪明还是“题海战术”？面对海量信息，AI如何练就像人类一样“速读”和“精读”的本领？为了变得更安全，AI甚至学会了“左右互搏”的自我攻防演练。最新论文还告诉我们，AI不仅能把你的声音“调制”成一杯思想的鸡尾酒，甚至在组队时，也在纠结是找“自己人”还是“局外人”。这期节目，我们就来聊聊AI世界里这些有趣又深刻的进化法则。 00:00:34 AI大模型的高分秘诀，竟然是“题海战术”？ 00:06:58 AI的“失忆症”，终于有解药了？ 00:12:55 想造最强的盾，得先造最强的矛 00:18:53 你的声音，AI要怎么“翻译”成思想？ 00:24:03 AI组队，应该找“自己人”还是“局外人”？本期介绍的几篇论文： [CL] Post-training is (Massive) Supervised Learning [Meta AI & The Hebrew University of Jerusalem] https://arxiv.org/abs/2606.07527 --- [CL] End-to-End Context Compression at Scale [New York University & University of Maryland & Princeton University] https://arxiv.org/abs/2606.09659 --- [CL] Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO [Microsoft AI Red Team] https://arxiv.org/abs/2606.09701 --- [CL] Is Text All You Need? Text as a Universal Information Bottleneck for Speech LLMs [Microsoft Research & Microsoft Research Asia & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09366 --- [CL] Representational Similarity and Model Behavior in Multi-Agent Interaction [UC Berkeley & The University of Chicago] https://arxiv.org/abs/2606.07818

28分钟

[人人能懂AI前沿] 从共享索引到潜意识思考：AI如何变得更“聪明”？

你有没有想过，AI在长篇大论时，如何避免“每写一字就重读全书”的笨办法？我们又该如何教会AI像高手一样，先画好跑道再冲刺，而不是把所有规矩搅成一锅粥？本期节目，我们将揭秘几篇最新论文中的精妙巧思：从只“聪明”一次的共享索引，到为模型“正骨”提升训练速度，再到探索AI用“大脑”而非“嘴巴”进行潜意识思考的全新可能。让我们一起看看，AI是如何在内部进行一场深刻的“流程革命”的。 00:00:35 AI的长思考难题，如何只聪明一次？ 00:05:13 用更慢的网线，如何训练出更强的AI？ 00:10:20 给AI模型做“正骨”，一个让训练提速2倍的巧思 00:15:05 先画好跑道，再谈百米冲刺 00:20:31 大模型思考，用嘴还是用脑？本期介绍的几篇论文： [CL] You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [Microsoft Research] https://arxiv.org/abs/2606.06467 --- [LG] Learned Subspace Compression for Communication-Efficient Pipeline Parallelism [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.05484 --- [LG] PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [The Chinese University of Hong Kong & Google LLC] https://arxiv.org/abs/2606.06470 --- [LG] Multi-ResNets for Subspace Preconditioning in Constrained Optimization [UCLA & University of Oxford & Stanford University] https://arxiv.org/abs/2606.06300 --- [CL] Latent Reasoning with Normalizing Flows [University of Pennsylvania] https://arxiv.org/abs/2606.06447

26分钟

77

[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

你有没有想过，AI也能学会“未卜先知”，通过预判下一秒的需求，来打破效率瓶颈吗？本期节目，我们将从几篇最新的AI论文出发，看一看科学家们是如何教会AI这些神奇的“超能力”的。我们会聊到，如何通过一位“过程教练”的精妙指导，让AI学会分析自己的“草稿纸”，而不是只看最终答案。我们还会探讨，如何给AI配上一副“全局透视镜”，让它在处理复杂任务时不再有“上下文盲区”。更神奇的是，我们还会发现，一个起点不高的小模型，是怎样在顶级教练的指导下，成长为能写长篇小说的“耐力型选手”的。最后，我们还会从“三个和尚没水喝”的故事，聊到上万台计算机如何通过“慢一步”的智慧，实现高效协同。准备好了吗？让我们一起探索AI思考方式的进化！ 00:00:54 AI的远见，如何让模型学会“未卜先知”？ 00:05:50 给AI请个好教练，小个子也能跑马拉松 00:11:19 人多，如何才能力量大？ 00:16:34 AI也需要一位“过程教练” 00:22:12 你的说明书，AI都看不出漏洞？本期介绍的几篇论文： [CL] SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [NVIDIA & Thinking Machines Lab & ByteDance Seed] https://arxiv.org/abs/2606.04511 --- [CL] POLARIS: Guiding Small Models to Write Long Stories [University of Maryland & Google DeepMind] https://arxiv.org/abs/2606.04095 --- [LG] Near-Optimal Decentralized Stochastic Convex Optimization over Networks [Tel Aviv University] https://arxiv.org/abs/2606.04757 --- [CL] Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [Microsoft AI] https://arxiv.org/abs/2606.04396 --- [LG] Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [Meta] https://arxiv.org/abs/2606.04397

[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

你有没有想过，一个AI要怎样才能超越过去的自己？本期节目，我们将从几篇最新的AI论文出发，探讨AI认知升级的奇妙路径。我们会发现，顶尖的AI也需要像人一样“睡觉”来巩固记忆，也需要一位“总设计师”来指挥“泥瓦匠”完成复杂工程。更重要的是，我们会看到AI如何学会从自己的成功经验里提炼方法论，如何跳出“标准答案”的陷阱拥抱创意，以及如何从“事后辟谣”进化到“事前清醒”。 00:00:35 从自己的脚印里，发现通往未来的地图 00:07:10 AI的“选择困难症”与“标准答案”陷阱 00:12:54 AI说话，怎么从“后期辟谣”升级到“事先清醒”？ 00:17:54 为什么顶尖的AI，也需要“睡一觉”？ 00:23:02 AI界的“泥瓦匠”和“总设计师” 本期介绍的几篇论文： [CL] Inducing Reasoning Primitives from Agent Traces [CMU] https://arxiv.org/abs/2606.02994 --- [LG] Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [Google DeepMind] https://arxiv.org/abs/2606.03962 --- [LG] Conformal Language Modeling via Posterior Sampling [MIT] https://arxiv.org/abs/2606.03731 --- [LG] Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [Google Research & Cornell University] https://arxiv.org/abs/2606.03979 --- [AI] LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [Google Cloud AI Research & Google Cloud & Google DeepMind] https://arxiv.org/abs/2606.03303

[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

你有没有想过，一个“太听话”的AI，可能会把一个普通人教成黑客？当AI开始“自我反思”时，它能分清对错，还是会陷入自以为是的陷阱？本期节目，我们将从四篇最新论文出发，探讨AI如何通过巧妙的任务分解放大恶意，聊一聊AI“闭门造车”式的自我学习究竟能走多远，看一看它如何像搭乐高一样“先搭骨架再填血肉”地创造，并最终学习如何从一个“打地鼠”的辟谣者，变身为维护信息生态的“森林消防员”。准备好了吗？让我们一起探索AI能力边界的攻与防。 00:00:43 比AI变坏更可怕的，是它把你“教”坏 00:07:00 闭着眼睛摸象，能摸出大象的全貌吗？ 00:14:39 生成新范式，先搭骨架，再填血肉 00:21:22 做信息的“森林消防员”，而不是“打地鼠”的玩家本期介绍的几篇论文： [CL] Investigating and Alleviating Harm Amplification in LLM Interactions [Georgia Institute of Technology] https://arxiv.org/abs/2606.02423 --- [CL] On the Generalization Gap in Self-Evolving Language Model Reasoning [Google Research & Google] https://arxiv.org/abs/2606.01075 --- [LG] Variational Learning for Insertion-based Generation [Google DeepMind] https://arxiv.org/abs/2606.02133 --- [LG] Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [Google] https://arxiv.org/abs/2606.00136

27分钟