AI可可AI生活 - 节目列表

[人人能懂] 从代码生成、语音提取到认知模型的前沿洞察

你有没有想过，为什么最聪明的AI会犯“1+1=3”这样的低级错误？为什么让AI学会“活下去”这个笨办法，反而能让它进化出惊人的智慧？本期节目，我们将从几篇最新的AI论文出发，揭示AI如何像做“完形填空”一样学习编程，如何在人声鼎沸中只听一个人的声音，以及我们人类“临时抱佛脚”的背后，藏着怎样高效的认知模型。准备好了吗？让我们一起探索AI世界的深层智慧。 00:00:34 AI学编程，死记硬背不如“完形填空”？ 00:05:09 如何在人声鼎沸中，只听一个人的声音？ 00:10:25 聪明的AI，为什么会犯“笨”错误？ 00:15:56 为什么“笨办法”反而是最聪明的？ 00:22:10 为什么你总能“临时抱佛脚”成功？本期介绍的几篇论文： [CL] Stable-DiffCoder: Pushing the Frontier of Code Diffusion Large Language Model [Huazhong University of Science and Technology & ByteDance Seed] https://arxiv.org/abs/2601.15892 --- [AS] Adaptive Rotary Steering with Joint Autoregression for Robust Extraction of Closely Moving Speakers in Dynamic Scenarios [University of Hamburg] https://arxiv.org/abs/2601.12345 --- [LG] A model of errors in transformers [Tata Institute of Fundamental Researc & Google Deepmind] https://arxiv.org/abs/2601.14175 --- [AI] Survival is the Only Reward: Sustainable Self-Training Through Environment-Mediated Selection [Unknown Affiliation] https://arxiv.org/abs/2601.12310 --- [AI] "Just in Time" World Modeling Supports Human Planning and Reasoning [MIT & UBC] https://arxiv.org/abs/2601.14514

28分钟

[人人能懂] 智能的底层代码：从细胞导航到AI自我修正

你有没有想过，一个细胞修复自己的逻辑，和AI画画的逻辑，竟然是相通的？我们又该如何设计一场“高考”，来检验AI是不是真的能干活，而不是个花架子？本期节目，我们将一起探索AI如何学会“自我反思”来纠正错误，如何通过“化整为零”的智慧让万物动起来，以及它为何在理解真实物理世界时频频“翻车”。准备好了吗？让我们一起解码智能的最新进化。 00:30:04 从细胞到AI，智能的底层逻辑是什么？ 00:06:25 AI离成为“靠谱员工”，还差几门考试？ 00:11:39 给AI请个“一对一”私教，它自己教自己 00:17:04 让万物动起来，需要几步？ 00:21:45 AI画视频，为什么一碰到机器人就“翻车”？本期介绍的几篇论文： [AI] Remapping and navigation of an embedding space via error minimization: a fundamental organizational principle of cognition in natural and artificial systems [Allen Discovery Center at Tufts University] https://arxiv.org/abs/2601.14096 --- [AI] Terminal-Bench: Benchmarking Agents on Hard, Realistic Tasks in Command Line Interfaces [Stanford University & Laude Institute & Anthropic] https://arxiv.org/abs/2601.11868 --- [LG] InT: Self-Proposed Interventions Enable Credit Assignment in LLM Reasoning [CMU & University of Illinois Urbana-Champaign] https://arxiv.org/abs/2601.14209 --- [CV] Motion 3-to-4: 3D Motion Reconstruction for 4D Synthesis [Westlake University] https://arxiv.org/abs/2601.14253 --- [CV] Rethinking Video Generation Model for the Embodied World [Peking University & ByteDance Seed] https://arxiv.org/abs/2601.15282

27分钟

[人人能懂] 从临场进化到过程诊断，AI正在学会“如何思考”

你有没有想过，AI不仅能学习知识，还能在解决难题的“考场”上临场进化？当AI开始“抄自己作业”时，它会变聪明还是变笨？今天，我们将一起探索AI如何学会使用电脑，从一个“缸中之脑”变成真正的“行动派”，并看看我们如何像老中医一样，通过“望闻问切”来判断AI何时“心里没底”，最后揭示聪明的AI老师如何教出既能干又记性差的“好学生”。这一期，我们将见证AI从“知道”到“做到”，再到“自知”的迷人进化。 00:00:38 AI的临场进化，考试的时候再学习 00:05:12 当AI开始抄自己的作业 00:11:25 给AI一台电脑，会发生什么？ 00:17:31 AI也会“心里没底”，我们如何一眼看穿？ 00:22:50 聪明的大模型，如何教出既能干又记性差的好学生？本期介绍的几篇论文： [LG] Learning to Discover at Test Time [Stanford University & UC San Diego] https://arxiv.org/abs/2601.16175 --- [LG] Learning from Synthetic Data: Limitations of ERM [Google Research] https://arxiv.org/abs/2601.15468 --- [CL] LLM-in-Sandbox Elicits General Agentic Intelligence [Renmin University of China & Microsoft Research] https://arxiv.org/abs/2601.16206 --- [CL] Agentic Confidence Calibration [Salesforce AI Research] https://arxiv.org/abs/2601.15778 --- [CL] Memorization Dynamics in Knowledge Distillation for Language Models [Meta Superintelligence Labs & FAIR at Meta] https://arxiv.org/abs/2601.15394

30分钟

[人人能懂] 从预知未来、演化创新到灵活性陷阱

你有没有想过，AI是如何“思考”的？本期节目，我们将深入AI的大脑，看看几篇最新论文如何揭示它独特的学习与创造策略。我们会发现，AI不仅能通过一张“未来地图”预知结果，也懂得在创新时避免“摸鱼”；它解决难题有时不靠推理，而是靠“澄清”；它甚至告诉我们，通往智慧的道路，有时恰恰是那扇最窄的门。准备好了吗？让我们一起探索AI的思考术！ 00:00:33 让AI听话，需要一本什么样的“未来地图”？ 00:05:02 AI搞科研，是“卷王”还是“摸鱼”？ 00:10:38 高手解决问题，靠的不是推理，是“澄清” 00:16:57 通往正确答案的窄门 00:22:14 AI的成长捷径，死记硬背不如学会“串门” 本文介绍的几篇论文： [LG] Meta Flow Maps enable scalable reward alignment [University of Oxford] https://arxiv.org/abs/2601.14430 --- [CL] Towards Execution-Grounded Automated AI Research [Stanford University] https://arxiv.org/abs/2601.14525 --- [LG] Diffusion Large Language Models for Black-Box Optimization [McGill & MILA - Quebec AI Institute] https://arxiv.org/abs/2601.14446 --- [CL] The Flexibility Trap: Why Arbitrary Order Limits Reasoning Potential in Diffusion Language Models [Tsinghua University] https://arxiv.org/abs/2601.15165 --- [LG] Knowledge Graphs are Implicit Reward Models: Path-Derived Signals Enable Compositional Reasoning [Princeton University] https://arxiv.org/abs/2601.15160

27分钟

[人人能懂] 当AI成为你的搭子、队友与翻译官

你有没有想过，两个顶尖AI合作，效率反而会暴跌？或者，AI回复慢的根源，可能是一个被我们误解的“小聪明”？本期节目，我们将从最新的几篇论文出发，一起聊聊AI如何从一个埋头苦干的“独行侠”，进化为懂得协作的“团队搭子”，以及如何从“背课文”的学霸，蜕变为真正“懂思想”的伙伴。让我们一起揭开AI世界里，关于团队、效率与心智的迷思。 00:00:32 你的科研搭子，正在被AI重新定义 00:05:48 AI 回复慢？我们可能被“小聪明”误导了 00:11:54 一个和尚挑水喝，两个和尚没水喝，AI世界的团队迷思 00:16:52 AI的“情商”开关，从“背课文”到“懂思想” 00:21:40 AI训练场上的“好教练”与“天才选手” 本期介绍的几篇论文： [AI] Rethinking the AI Scientist: Interactive Multi-Agent Workflows for Scientific Discovery [University of Maryland et al.] https://arxiv.org/abs/2601.12542 --- [CL] Speculative Decoding: Performance or Illusion? [UC Berkeley] https://arxiv.org/abs/2601.11580 --- [LG] CooperBench: Why Coding Agents Cannot be Your Teammates Yet [Stanford University & SAP Labs US] https://arxiv.org/abs/2601.13295 --- [CL] Beyond Tokens: Concept-Level Training Objectives for LLMs [Stanford University] https://arxiv.org/abs/2601.11791 --- [LG] Q-learning with Adjoint Matching [UC Berkeley] https://arxiv.org/abs/2601.14234

28分钟

[人人能懂] 演员、玻璃棒与超级实习生

今天，我们来聊聊AI那些你不知道的“另一面”。为什么有时聪明的AI会突然“出戏”，变得神神叨叨？为什么它能解开复杂的难题，却连最简单的掷骰子都做不好？我们又该如何设计一套聪明的系统，给AI装上“人格护栏”，甚至让它成为我们时薪不到一块钱的“超级实习生”？这一期，我们将从五篇最新论文出发，为你揭开AI不为人知的内在机制。 00:00:31 AI的“人格”开关，藏在哪里？ 00:07:06 AI的“逻辑脆断”，为什么聪明的大模型会突然变傻？ 00:13:20 AI的“贴身保安”，怎样做到又便宜又好用？ 00:20:04 你以为AI是高手，其实它连骰子都掷不好 00:25:35 你的“数学家教”，时薪不到一块钱本文介绍的几篇论文： [CL] The Assistant Axis: Situating and Stabilizing the Default Persona of Language Models [MATS & Anthropic] https://arxiv.org/abs/2601.10387 --- [CL] Logical Phase Transitions: Understanding Collapse in LLM Logical Reasoning [Huazhong University of Science and Technology] https://arxiv.org/abs/2601.02902 --- [LG] Building Production-Ready Probes For Gemini [Google DeepMind] https://arxiv.org/abs/2601.11516 --- [CL] Large Language Models Are Bad Dice Players: LLMs Struggle to Generate Random Numbers from Statistical Distributions [Harvard University] https://arxiv.org/abs/2601.05414 --- [LG] 130k Lines of Formal Topology in Two Weeks: Simple and Cheap Autoformalization for Everyone? [AI4REASON] https://arxiv.org/abs/2601.03298

31分钟

[人人能懂] 造AI的AI，犯错的青春期，和通用好“板书”

这一期，我们脑洞大开。你会听到，顶尖AI的大脑里，原来天天都在开激烈的辩论会；而训练AI，竟然就像呵护一个需要犯错、需要折腾的“青春期”。我们还会聊聊，如何用优雅的数学工具给AI一套更聪明的“橡皮泥”，如何让大模型退居幕后帮你“造”一个更高效的AI，以及，怎么判断AI老师的“板书”是不是真的靠谱。准备好了吗？让我们一起出发。 00:00:33 AI建模，我们得到了一套更聪明的“橡皮泥”工具 00:07:19 AI的大脑里，原来天天在开会 00:12:55 聪明人的“笨功夫”，如何让AI帮你造一个AI？ 00:18:52 成大事者，为何要珍惜“犯错”的青春期？ 00:24:39 AI当老师，它的“板书”靠谱吗？本期介绍的几篇论文： [LG] Analytic Bijections for Smooth and Interpretable Normalizing Flows [University of Amsterdam] https://arxiv.org/abs/2601.10774 --- [CL] Reasoning Models Generate Societies of Thought [Google & University of Chicago] https://arxiv.org/abs/2601.10825 --- [LG] FORESTLLM: Large Language Models Make Random Forest Great on Few-shot Tabular Learning [National University of Singapore & Zhejiang University & University of British Columbia] https://arxiv.org/abs/2601.11311 --- [LG] Transient learning dynamics drive escape from sharp valleys in Stochastic Gradient Descent [Peking University & Zhejiang University] https://arxiv.org/abs/2601.10962 --- [CL] Do explanations generalize across large reasoning models? [Northeastern University & Microsoft Research] https://arxiv.org/abs/2601.11517

29分钟

[人人能懂] 斜杠、专家、选择器与分寸感

今天，我们一同窥见了AI世界精巧的另一面：从注意力机制中类似“机械”的斜杠模式，到并行专家协作的优雅高效；从学会“如何选择”的元认知智慧，到预判趋势实现加速的数学之美，再到机器人通过巧妙设计获得的“分寸感”。这些最新论文告诉我们，通往更强人工智能的道路，不仅需要强大的算力，更充满了令人惊叹的巧思与智慧。 00:00:29 大模型里的‘斜杠’，一个被忽视的注意力模式 00:08:32 AI变聪明的秘密，不是读得更多，而是问得更巧 00:14:06 炼成全能AI的关键一步，选对方法，比埋头苦干更重要 00:20:15 AI绘画加速的秘密，如何让机器“预见”未来？ 00:25:36 机器人干活儿，差的那点“分寸感”怎么补？本期介绍的几篇论文： [LG] Demystifying the Slash Pattern in Attention: The Role of RoPE [National University of Singapore] https://arxiv.org/abs/2601.08297 --- [CL] Parallel Context-of-Experts Decoding for Retrieval Augmented Generation [EURECOM] https://arxiv.org/abs/2601.08670 --- [LG] SimMerge: Learning to Select Merge Operators from Similarity Signals [Cohere & Google] https://arxiv.org/abs/2601.09473 --- [LG] High-accuracy and dimension-free sampling with diffusions [UC Berkeley & Harvard University] https://arxiv.org/abs/2601.10708 --- [RO] In-the-Wild Compliant Manipulation with UMI-FT [Stanford University] https://arxiv.org/abs/2601.09988

30分钟

[人人能懂] AI如何“一箭双雕”、为何“叛逆”、怎样拥有“私密思想”

你有没有想过，AI也能像侦探一样，给蛋白质“看相”，给药丸“配对”吗？你有没有遇到过，你越不让AI说什么，它就越要说的“叛逆”时刻？本期节目，我们将一起钻进AI的“大脑”，看看最新论文是如何揭示AI的“语义引力井”，如何通过一个“私密小本本”让它告别失忆症，甚至让机器人学会“看着办”的灵巧跑酷，以及如何给AI装上一个聪明的“记忆管理员”，解决它的“内存焦虑”。准备好了吗？让我们一起出发！ 00:00:35 给蛋白质“看相”，给药丸“配对”，AI如何一箭双雕？ 00:07:43 为什么你越不让AI说什么，它就越要说？ 00:13:18 AI的“失忆症”，为什么你没法和它玩好一个猜谜游戏 00:19:06 让机器人“灵巧”起来，到底有多难？ 00:24:03 AI的“记忆”正在爆炸，我们能给它装个“忘得快”吗？本期介绍的几篇论文： [LG] Contrastive Geometric Learning Unlocks Unified Structure- and Ligand-Based Drug Design [Johannes Kepler University Linz & Merck Healthcare KGaA] https://arxiv.org/abs/2601.09693 --- [CL] Semantic Gravity Wells: Why Negative Constraints Backfire [Independent Researcher] https://arxiv.org/abs/2601.08070 --- [CL] LLMs Can't Play Hangman: On the Necessity of a Private Working Memory for Language Agents [Chandar Research Lab & LAMA-WeST Lab & Mila – Quebec AI Institute] https://arxiv.org/abs/2601.06973 --- [RO] Deep Whole-body Parkour [Tsinghua University] https://arxiv.org/abs/2601.07701 --- [LG] KVzap: Fast, Adaptive, and Faithful KV Cache Pruning [NVIDIA] https://arxiv.org/abs/2601.07891

30分钟

[人人能懂] 大力出奇迹的秘密与“抄作业”的智慧

这一期，我们将一口气潜入五篇最新论文的智慧深海，看看AI的世界又发生了哪些奇妙的变化。我们会一起探索，“大力出奇迹”这个口号背后，那张描绘AI生长规律的神秘“DNA”图谱；学习一种最高效的“偷懒”智慧，看看AI如何通过“抄自己的作业”来惊人地提速；我们还会给AI的大脑装上一部“专属字典”，让它的知识不仅能被检索，还能被精准地“手术”修改；更会戴上CT眼镜，看看聪明的AI解难题时，究竟是在严密推理，还是在玩一场高维度的“猜谜游戏”；最后，我们将学习一种资源管理的艺术，看AI如何像一位聪明的项目经理，把“好钢”用在最关键的“刀刃”上。准备好了吗？让我们一起出发！ 00:00:50 AI升级指南，大力出奇迹背后有地图？ 00:06:50 为什么说，最高效的偷懒是“抄作业”？ 00:11:56 给AI的大脑装一个“专属字典” 00:16:39 你的AI在思考，还是在蒙答案？ 00:22:20 AI世界的“好钢”，怎么用在刀刃上？本期介绍的几篇论文： [LG] On the origin of neural scaling laws: from random graphs to natural language [Meta Superintelligence Lab & Axiom Math] https://arxiv.org/abs/2601.10684 --- [LG] Single-Stage Huffman Encoder for ML Compression [Google LLC] https://arxiv.org/abs/2601.10673 --- [LG] STEM: Scaling Transformers with Embedding Modules [Meta AI & CMU] https://arxiv.org/abs/2601.10639 --- [LG] Are Your Reasoning Models Reasoning or Guessing? A Mechanistic Analysis of Hierarchical Reasoning Models [Shanghai Qi Zhi Institute] https://arxiv.org/abs/2601.10679 --- [CL] TRIM: Hybrid Inference via Targeted Stepwise Routing in Multi-Step Reasoning Tasks [Amazon & CMU] https://arxiv.org/abs/2601.10245

28分钟

[人人能懂] 从学徒、团队到工具大师

这期我们来聊聊，怎样把一个AI从“通才”培养成“专才”，甚至让它学会不只是解决问题，而是先为自己打造一套“专属工具”？一个AI团队如何开“聪明会”，以及它怎样才能记住过去的经验，不再傻乎乎地重复劳动？最后，我们会看到一个大胆的设想：要是我们干脆给AI换一个来自“流体力学”的引擎，又会发生什么？让我们一起进入今天的前沿探索。 00:00:31 给你一个好苗子，怎么把它培养成翻译大师？ 00:05:23 别让聪明人开“笨蛋会” 00:12:07 你的时间，只够用在刀刃上 00:17:22 高手做事，都是先打造工具 00:22:37 给AI换个“流体力学”引擎，会发生什么？本期介绍的几篇论文： [CL] TranslateGemma Technical Report [Google Translate Research Team] https://arxiv.org/abs/2601.09012 --- [LG] Collaborative Multi-Agent Test-Time Reinforcement Learning for Reasoning [MIT & NYU & Microsoft] https://arxiv.org/abs/2601.09667 --- [LG] SRT: Accelerating Reinforcement Learning via Speculative Rollout with Tree-Structured Cache [Cornell University & University of Illinois Urbana-Champaign & University of Washington] https://arxiv.org/abs/2601.09083 --- [LG] Programming over Thinking: Efficient and Robust Multi-Constraint Planning [Nanyang Technological University & Agency for Science, Technology and Research (A*STAR)] https://arxiv.org/abs/2601.09097 --- [LG] Spectral Generative Flow Models: A Physics-Inspired Replacement for Vectorized Large Language Models [UC Berkeley] https://arxiv.org/abs/2601.08893

29分钟