AI可可AI生活 - 节目列表

你是否也曾好奇，AI离拥有真正的“人性”还有多远？本期节目，我们将用几篇最新的论文，带你进行一次脑力激荡。我们会看到，如果用《帝国时代》里的绵羊也能搭建出一个AI，我们对它的“智能”判断是否会改变。接着，我们会探讨AI如何像我们一样学会“举一反三”，以及如何通过一套神奇的“外骨骼”，让机器人拥有人类的“手感”。最后，我们还会揭晓一种专为AI设计的“防作弊”考题，看看它到底是“原理型学霸”还是“题库型学霸”。准备好，让我们一起出发，探索AI认知的边界！ 00:00:00 AI有灵魂吗？先问问“帝国时代”里的羊 00:06:03 AI的学习捷径，为什么“举一反三”比“死记硬背”更高效？ 00:11:31 如何用“现在”的智慧，教会“过去”的自己 00:16:56 机器人摸着石头过河，靠的是什么？ 00:21:50 你的模型，是真的懂了，还是在背题库？本期介绍的几篇论文： [CL] If LLMs Have Human-Like Attributes, Then So Does Age of Empires II [Microsoft & The University of York] https://arxiv.org/abs/2605.31514 --- [LG] Learn from your own latents and not from tokens: A sample-complexity theory [EPFL & University of Cambridge & Johns Hopkins University] https://arxiv.org/abs/2605.27734 --- [LG] Pretraining Recurrent Networks without Recurrence [MIT] https://arxiv.org/abs/2606.06479 --- [RO] Universal Manipulation Exoskeleton: Learning Compliant Whole-body Policies with Real-time Torque Feedback [Ant Group] https://arxiv.org/abs/2606.14218 --- [LG] A Held-Out Transition-Pair Falsifier for Long-Horizon Non-Abelian State Tracking [Attractor Dynamics] https://arxiv.org/abs/2606.07254

2天前

[人人能懂AI前沿] AI如何深度思考？怎样成为说服大师？能创造游戏吗？

你有没有想过，一个更聪明的AI，是靠更大的模型，还是更深的“思考”？本期节目，我们将看到AI如何通过“反复打磨”超越百倍于自己的对手，如何用惊人的“信息密度”在辩论中战胜人类世界冠军。我们还会一起探索，当AI开始尝试建立自己的“世界观”、从零创造一个完整的游戏、甚至像我们一样行动时，一个怎样的新世界正在向我们走来。 00:00:29 聪明人的“笨功夫”，AI世界的新思考维度 00:06:39 那个最会“说话”的，已经不是人了 00:13:11 让AI拥有“世界观”，而不只是个“美图秀秀” 00:19:56 AI当“码农”可以，当“游戏制作人”呢？ 00:25:33 向人学习，机器才能像人一样行动本期介绍的几篇论文： [LG] Looped World Models [FaceMind Research Asia] https://arxiv.org/abs/2606.18208 [AI] AI systems out-persuade expert humans [University of Oxford & UK AI Security Institute & Stanford University] https://arxiv.org/abs/2606.16475 [AI] Kairos: A Native World Model Stack for Physical AI [Kairos Team] https://arxiv.org/abs/2606.16533 [CL] GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] https://arxiv.org/abs/2606.17861 [RO] Human Universal Grasping [New York University] https://arxiv.org/abs/2606.17054

31分钟

3天前

[人人能懂AI前沿] 当AI开始说“电报”，做“清醒梦”，解“人性方程”

你有没有想过，AI之间开始说我们听不懂的“悄悄话”是为了什么？一个AI要学会新技能，最好的方法竟然是扔掉我们给它的“拐杖”？这期节目，我们就来聊聊几篇有趣的最新论文：看AI如何自创“电报文”实现高效沟通，用“清醒的梦”来检验学习成果，甚至尝试解开说服你的“人性方程”。准备好了吗？让我们一起探索AI正在发生的、超乎你想象的进化！ 00:00:31 当机器开始说“电报”，AI沟通的下一次进化 00:05:06 AI学习的“断舍离”，扔掉“拐杖”，它能走得更远？ 00:10:55 小模型的大道理，为什么30亿参数能挑战万亿巨头？ 00:16:03 如何让机器人做一个“清醒的梦”？ 00:21:51 想说服我？先解开这道“人性方程” 本期介绍的几篇论文： [CL] Large Language Models Do Not Always Need Readable Language [Shanghai Jiao Town University & The University of Sydney & Hefei University of Technology] https://arxiv.org/abs/2606.19857 --- [CV] You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences [UIUC & New York University] https://arxiv.org/abs/2606.15956 --- [CL] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models [Sina Weibo Inc] https://arxiv.org/abs/2606.16140 --- [RO] SC3-Eval: Evaluating Robot Foundation Models via Self-Consistent Video Generation [University of Toronto & Physical Intelligence & NVIDIA] https://arxiv.org/abs/2606.18610 --- [AI] Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games [Princeton University] https://arxiv.org/abs/2606.17657

4天前

[人人能懂AI前沿] AI高手进化论：从内部评价、全局思考到经验共享

要成为一个高手，究竟是该埋头苦练，还是在玩耍中摸索？是靠严苛的自我反思，还是借鉴他人的成功路径？今天，几篇最新的AI论文将带我们一探究竟：当AI学会了像画家一样整体构思、像孩子一样自由玩耍、甚至懂得分享经验形成集体智慧时，一个全新的“高手进化论”正在被书写。 00:00:27 如何像高手一样，给自己建立一套内部评价标准 00:06:28 AI的新玩法，从写文章到画油画 00:12:21 AI当助教，机器人如何告别笨拙，学会精细活？ 00:16:56 你的下一个高手，可能不是“练”出来的，而是“玩”出来的 00:22:37 你的经验，如何变成别人的能力？本期介绍的几篇论文： [LG] VIMPO: Value-Implicit Policy Optimization for LLMs [UC Berkeley & Yale University] https://arxiv.org/abs/2606.20008 --- [LG] How Transparent is DiffusionGemma? [Google DeepMind] https://arxiv.org/abs/2606.20560 --- [AI] ENPIRE: Agentic Robot Policy Self-Improvement in the Real World [NVIDIA & CMU] https://arxiv.org/abs/2606.19980 --- [RO] Playful Agentic Robot Learning [UC Berkeley] https://arxiv.org/abs/2606.19419 --- [AI] Multi-Agent Transactive Memory [CMU] https://arxiv.org/abs/2606.19911

30分钟

5天前

[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

你是否想过，如何让“口是心非”的AI学会言行一致，又如何让手机App在“懂你”的同时做到“不认识你”？本期节目，我们将一起揭秘几篇最新论文，看看科学家们如何用“左右互搏”大法驯服AI，用“精准激励”破解AI的“中年危机”，甚至将AI的“直觉”直接翻译成我们能读懂的代码。准备好了吗？让我们一起出发！ 00:00:27 驯服AI野马，从“口是心非”到“知行合一” 00:06:49 鱼与熊掌，如何让App既“懂你”又“不认识你”？ 00:11:27 如何破解AI训练的“中年危机”？ 00:16:48 让机器人学会“看样学样”，总共分几步？ 00:22:52 把AI的“直觉”翻译成代码，会发生什么？本期介绍的几篇论文： [LG] Self-CTRL: Self-Consistency Training with Reinforcement Learning [MIT CSAIL] https://arxiv.org/abs/2606.18327 --- [LG] Private Learning with Public Feature Conditioning [AWS Agentic AI & Microsoft & Google Research] https://arxiv.org/abs/2606.18773 --- [LG] STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability [Tencent Hunyuan & Tsinghua University] https://arxiv.org/abs/2606.19236 --- [RO] Do as I Do: Dexterous Manipulation Data from Everyday Human Videos [UC Berkeley] https://arxiv.org/abs/2606.19333 --- [LG] Explaining Attention with Program Synthesis [NJIT & MIT EECS] https://arxiv.org/abs/2606.19317

6天前

[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

今天我们要聊点特别的，看看科学家们是如何用一些生活中的大智慧，来教AI学得更聪明。我们会探索四篇最新论文，看看如何给AI配一个靠谱的“数学翻译官”，让它不再胡说八道；又如何像一位金牌私教，通过“错题本”和“二选一”来因材施教。接着，我们会揭秘一种神奇的“反向学习法”，让AI通过观察就能比老师做得更好；最后，我们还会聊聊为什么给大模型一个“沙漏身材”，会比传统的“水桶身材”更高效。准备好了吗？让我们一起出发！ 00:00:36 给AI装一个靠谱的数学翻译官 00:05:03 AI界的“因材施教”，如何让小模型学得更聪明？ 00:10:32 如何让机器“反向”学习，变得比老师更聪明？ 00:16:08 只看结果，你可能错过了真正的第一名 00:22:15 AI大模型的新身材，为什么“沙漏”比“水桶”好？本期介绍的几篇论文： [LG] Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics [University of Washington] https://arxiv.org/abs/2606.17581 --- [CL] Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients [NVIDIA] https://arxiv.org/abs/2606.18216 --- [LG] Reversal Q-Learning [UC Berkeley] https://arxiv.org/abs/2606.17551 --- [LG] Offline Preference-Based Trajectory Evaluation [CMU] https://arxiv.org/abs/2606.17541 --- [CL] Variable-Width Transformers [MIT] https://arxiv.org/abs/2606.18246

93

[人人能懂AI前沿] 从数据主旋律、训练菜谱到探索式学习

你有没有想过，我们该如何“教育”一个AI？是让它死记硬背标准答案，还是给它海量数据让它自己野蛮生长？今天，我们就从几篇最新的AI论文出发，像一位精明的“AI成长规划师”，探讨如何让AI学得更聪明、更深刻。我们将一起揭开AI在猜谜游戏中的意外“短板”，学习如何为它定制一份防止“偏科”的训练菜谱，并探索一种比标准答案更重要的“过程奖励”机制。 00:00:32 你以为AI很聪明？它可能连猜谜游戏都玩不好 00:05:54 聪明AI的“偏科”难题 00:10:57 数据太多喂不饱AI？你需要找到主旋律 00:15:45 AI军备竞赛，真正的决胜点，在你看不到的数据战场 00:20:52 比“标准答案”更重要的东西本期介绍的几篇论文： [CL] Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning [The Hebrew University of Jerusalem & New York University] https://arxiv.org/abs/2606.16576 --- [LG] How Post-Training Shapes Biological Reasoning Models [Harvard University] https://arxiv.org/abs/2606.16517 --- [LG] Active Learning with Low-Rank Structure for Data Selection [Google Research & UC Berkeley] https://arxiv.org/abs/2606.16045 --- [CL] Spokes: Optimizing for Diverse Pretraining Data Selection [DSO National Laboratories & Stanford University & University of Washington] https://arxiv.org/abs/2606.15216 --- [LG] ExpRL: Exploratory RL for LLM Mid-Training [Stanford University & CMU & OpenAI] https://arxiv.org/abs/2606.17024

27分钟

[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

你有没有想过，我们如何给AI这头“吞金兽”来一次彻底的瘦身和压缩？如何为它设计一张分工明确的“组织架构图”，让“调度员”和“专家”各司其职？我们又该如何给它装上一个既能规避灾难性风险，又能动态调整预算的“安全大脑”？当AI自己当上“裁判”时，我们如何确保它不是在抛硬币？本期节目，我们将通过几篇最新的研究，一起探索如何让AI变得更高效、更聪明，也更可靠。 00:00:31 驯服AI的新兵法，“共享”与“压缩” 00:06:36 给AI画一张“组织架构图”，谁是调度员，谁是专家？ 00:13:07 如何让AI既能干，又不出事？ 00:18:11 AI当裁判，是明察秋毫，还是抛硬币？ 00:23:49 给AI上好“紧箍咒”，它才能学得又快又稳本期介绍的几篇论文： [LG] Gefen: Optimized Stochastic Optimizer [Reichman University & Tel Aviv University] https://arxiv.org/abs/2606.13894 --- [LG] A theoretical model for task routing in mixture-of-expert transformers [University of Sydney & Zhejiang University] https://arxiv.org/abs/2606.14398 --- [LG] Utility-Constrained Policy Optimization [York University & Google DeepMind] https://arxiv.org/abs/2606.14029 --- [CL] The Coin Flip Judge? Reliability and Bias in LLM-as-a-Judge Evaluation [A Yagubyan] https://arxiv.org/abs/2606.13685 --- [LG] Diffusion Policy Optimization without Drifting Apart [UC Berkeley] https://arxiv.org/abs/2606.13795

30分钟

[人人能懂AI前沿] AI的成长三部曲：学会约束、学会思考、学会记忆

如果AI像个学生，我们该如何教育它？本期节目，我们将一起探索几篇最新论文带来的惊人答案：我们将看到，如何用一根充满智慧的“弹力绳”防止AI“学疯了”；如何用一棵“假设树”教会AI像科学家一样累积经验；我们还会举办一场AI记忆力大赛，看看究竟是“死记硬背”还是“内在结构”更胜一筹；最后，我们将揭示一种让AI“开卷的我”去教“闭卷的我”的神奇训练法，并学会如何像外科医生一样，为AI精准“切除”坏习惯。准备好了吗？让我们一起看看，人类是如何教会AI“学习如何学习”的。 00:00:42 AI“学疯了”怎么办？一根“弹力绳”的智慧 00:06:42 如何让AI像科学家一样思考？ 00:13:26 你的记忆，是“看过”还是“记住”了？ 00:19:22 AI训练的新思路，优等生是如何“开卷”带“闭卷”的？ 00:25:10 我们给AI的“好评”，正在让它变“笨”吗？本期介绍的几篇论文： [LG] Rethinking the Divergence Regularization in LLM RL [Tencent Hunyuan & NUS] https://arxiv.org/abs/2606.09821 --- [CL] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement [Microsoft Research & Renmin University of China] https://arxiv.org/abs/2606.11926 --- [CV] Echo-Memory: A Controlled Study of Memory in Action World Models [The University of Hong Kong & Joy Future Academy, JD & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09803 --- [LG] Rubric-Guided Self-Distillation: Post-Training Without Rubric Verifiers [Scale AI] https://arxiv.org/abs/2606.12507 --- [LG] Anatomy of Post-Training: Using Interpretability to Characterize Data and Shape the Learning Signal [GOODFIRE] https://arxiv.org/abs/2606.12360

32分钟

[人人能懂AI前沿] 给AI装上“第六感”：从感知、记忆到协作的全面升级

你有没有想过，未来的AI不再只是一个“大力士”，而是一个善用巧劲的“策略家”？本期节目，我们将一起探寻几篇最新论文，看看AI如何学会像我们一样“抓重点”来读懂万字长文，又如何通过一个“共享白板”实现高效团队协作。我们还会揭秘，AI怎样无中生有地获得“第六感”，如何靠着一本“记忆草稿本”创作出不会失忆的长视频，以及它又是怎样得到一支“魔法棒”，能对你的文章进行外科手术般的精准修改。准备好了吗？让我们一起看看AI是如何变聪明的！ 00:00:39 你的手机，是怎么“偷懒”变聪明的？ 00:05:03 人多不一定力量大，但“会开会”的团队可以 00:11:33 给机器装上“第六感”，一种更聪明的学习方式 00:18:02 AI做长视频，怎样才能不“失忆”？ 00:23:18 给AI一支“局部修改”的魔法棒本期介绍的几篇论文： [LG] MiniMax Sparse Attention: MiniMax is a surprisingly effective reward for instruction following [MiniMax] https://arxiv.org/abs/2606.13392 --- [LG] Decentralized Multi-Agent Systems with Shared Context: Decentralized Multi-Agent Systems with Shared Context [Stanford University] https://arxiv.org/abs/2606.10662 --- [RO] FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning [CMU] https://arxiv.org/abs/2606.12406 --- [CV] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation: MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation [MIT & Toyota Research Institute] https://arxiv.org/abs/2606.09056 --- [CL] TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering: TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering [MBZUAI] https://arxiv.org/abs/2606.08408

29分钟

[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

你有没有想过，当AI变得比我们更聪明时，它会是什么样子？我们又该如何为五花八门的AI办一场公平的“奥运会”？本期节目，我们将一起探索通往超级智能的四条可能路径，看看科学家们如何将“炼丹”般的AI调参过程，变成“看图施工”的科学方法。我们还会揭秘一种让AI画画速度更快、质量不变的“师徒协作”新技巧，并最终探讨一个深刻的问题：当我们向AI寻求人生建议时，它究竟是智慧的“诸葛亮”，还是只想讨好你的“马屁精”？ 00:00:36 AI的下一站，以及通往未来的四条路 00:06:20 如何给AI办一场公平的“奥运会”？ 00:11:43 AI调参，从“炼丹玄学”到“看图施工” 00:16:30 AI画画慢？一种“组团验收”的加速心法 00:24:05 如何判断你的AI顾问，是“诸葛亮”还是“马屁精”？本期介绍的几篇论文： [AI] From AGI to ASI [Google DeepMind] https://arxiv.org/abs/2606.12683 --- [AI] AgentBeats: Agentifying Agent Assessment for Openness, Standardization, and Reproducibility [UC Berkeley & University of California, Santa Cruz] https://arxiv.org/abs/2606.13608 --- [LG] LoRA-Muon: Spectral Steepest Descent on the Low-Rank Manifold [EleutherAI] https://arxiv.org/abs/2606.12921 --- [LG] Accelerating Speculative Diffusions via Block Verification [Google Research & Google DeepMind] https://arxiv.org/abs/2606.13426 --- [LG] Normative Robustness as a Frontier for Non-Verifiable Reasoning in LLMs [Google DeepMind & Imperial College London] https://arxiv.org/abs/2606.12731

30分钟