AI可可AI生活 - 节目列表

你是否也曾好奇，AI离拥有真正的“人性”还有多远？本期节目，我们将用几篇最新的论文，带你进行一次脑力激荡。我们会看到，如果用《帝国时代》里的绵羊也能搭建出一个AI，我们对它的“智能”判断是否会改变。接着，我们会探讨AI如何像我们一样学会“举一反三”，以及如何通过一套神奇的“外骨骼”，让机器人拥有人类的“手感”。最后，我们还会揭晓一种专为AI设计的“防作弊”考题，看看它到底是“原理型学霸”还是“题库型学霸”。准备好，让我们一起出发，探索AI认知的边界！ 00:00:00 AI有灵魂吗？先问问“帝国时代”里的羊 00:06:03 AI的学习捷径，为什么“举一反三”比“死记硬背”更高效？ 00:11:31 如何用“现在”的智慧，教会“过去”的自己 00:16:56 机器人摸着石头过河，靠的是什么？ 00:21:50 你的模型，是真的懂了，还是在背题库？本期介绍的几篇论文： [CL] If LLMs Have Human-Like Attributes, Then So Does Age of Empires II [Microsoft & The University of York] https://arxiv.org/abs/2605.31514 --- [LG] Learn from your own latents and not from tokens: A sample-complexity theory [EPFL & University of Cambridge & Johns Hopkins University] https://arxiv.org/abs/2605.27734 --- [LG] Pretraining Recurrent Networks without Recurrence [MIT] https://arxiv.org/abs/2606.06479 --- [RO] Universal Manipulation Exoskeleton: Learning Compliant Whole-body Policies with Real-time Torque Feedback [Ant Group] https://arxiv.org/abs/2606.14218 --- [LG] A Held-Out Transition-Pair Falsifier for Long-Horizon Non-Abelian State Tracking [Attractor Dynamics] https://arxiv.org/abs/2606.07254

6天前

[人人能懂AI前沿] AI如何深度思考？怎样成为说服大师？能创造游戏吗？

你有没有想过，一个更聪明的AI，是靠更大的模型，还是更深的“思考”？本期节目，我们将看到AI如何通过“反复打磨”超越百倍于自己的对手，如何用惊人的“信息密度”在辩论中战胜人类世界冠军。我们还会一起探索，当AI开始尝试建立自己的“世界观”、从零创造一个完整的游戏、甚至像我们一样行动时，一个怎样的新世界正在向我们走来。 00:00:29 聪明人的“笨功夫”，AI世界的新思考维度 00:06:39 那个最会“说话”的，已经不是人了 00:13:11 让AI拥有“世界观”，而不只是个“美图秀秀” 00:19:56 AI当“码农”可以，当“游戏制作人”呢？ 00:25:33 向人学习，机器才能像人一样行动本期介绍的几篇论文： [LG] Looped World Models [FaceMind Research Asia] https://arxiv.org/abs/2606.18208 [AI] AI systems out-persuade expert humans [University of Oxford & UK AI Security Institute & Stanford University] https://arxiv.org/abs/2606.16475 [AI] Kairos: A Native World Model Stack for Physical AI [Kairos Team] https://arxiv.org/abs/2606.16533 [CL] GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] https://arxiv.org/abs/2606.17861 [RO] Human Universal Grasping [New York University] https://arxiv.org/abs/2606.17054

31分钟

[人人能懂AI前沿] 当AI开始说“电报”，做“清醒梦”，解“人性方程”

你有没有想过，AI之间开始说我们听不懂的“悄悄话”是为了什么？一个AI要学会新技能，最好的方法竟然是扔掉我们给它的“拐杖”？这期节目，我们就来聊聊几篇有趣的最新论文：看AI如何自创“电报文”实现高效沟通，用“清醒的梦”来检验学习成果，甚至尝试解开说服你的“人性方程”。准备好了吗？让我们一起探索AI正在发生的、超乎你想象的进化！ 00:00:31 当机器开始说“电报”，AI沟通的下一次进化 00:05:06 AI学习的“断舍离”，扔掉“拐杖”，它能走得更远？ 00:10:55 小模型的大道理，为什么30亿参数能挑战万亿巨头？ 00:16:03 如何让机器人做一个“清醒的梦”？ 00:21:51 想说服我？先解开这道“人性方程” 本期介绍的几篇论文： [CL] Large Language Models Do Not Always Need Readable Language [Shanghai Jiao Town University & The University of Sydney & Hefei University of Technology] https://arxiv.org/abs/2606.19857 --- [CV] You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences [UIUC & New York University] https://arxiv.org/abs/2606.15956 --- [CL] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models [Sina Weibo Inc] https://arxiv.org/abs/2606.16140 --- [RO] SC3-Eval: Evaluating Robot Foundation Models via Self-Consistent Video Generation [University of Toronto & Physical Intelligence & NVIDIA] https://arxiv.org/abs/2606.18610 --- [AI] Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games [Princeton University] https://arxiv.org/abs/2606.17657

[人人能懂AI前沿] AI高手进化论：从内部评价、全局思考到经验共享

要成为一个高手，究竟是该埋头苦练，还是在玩耍中摸索？是靠严苛的自我反思，还是借鉴他人的成功路径？今天，几篇最新的AI论文将带我们一探究竟：当AI学会了像画家一样整体构思、像孩子一样自由玩耍、甚至懂得分享经验形成集体智慧时，一个全新的“高手进化论”正在被书写。 00:00:27 如何像高手一样，给自己建立一套内部评价标准 00:06:28 AI的新玩法，从写文章到画油画 00:12:21 AI当助教，机器人如何告别笨拙，学会精细活？ 00:16:56 你的下一个高手，可能不是“练”出来的，而是“玩”出来的 00:22:37 你的经验，如何变成别人的能力？本期介绍的几篇论文： [LG] VIMPO: Value-Implicit Policy Optimization for LLMs [UC Berkeley & Yale University] https://arxiv.org/abs/2606.20008 --- [LG] How Transparent is DiffusionGemma? [Google DeepMind] https://arxiv.org/abs/2606.20560 --- [AI] ENPIRE: Agentic Robot Policy Self-Improvement in the Real World [NVIDIA & CMU] https://arxiv.org/abs/2606.19980 --- [RO] Playful Agentic Robot Learning [UC Berkeley] https://arxiv.org/abs/2606.19419 --- [AI] Multi-Agent Transactive Memory [CMU] https://arxiv.org/abs/2606.19911

30分钟

[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

你是否想过，如何让“口是心非”的AI学会言行一致，又如何让手机App在“懂你”的同时做到“不认识你”？本期节目，我们将一起揭秘几篇最新论文，看看科学家们如何用“左右互搏”大法驯服AI，用“精准激励”破解AI的“中年危机”，甚至将AI的“直觉”直接翻译成我们能读懂的代码。准备好了吗？让我们一起出发！ 00:00:27 驯服AI野马，从“口是心非”到“知行合一” 00:06:49 鱼与熊掌，如何让App既“懂你”又“不认识你”？ 00:11:27 如何破解AI训练的“中年危机”？ 00:16:48 让机器人学会“看样学样”，总共分几步？ 00:22:52 把AI的“直觉”翻译成代码，会发生什么？本期介绍的几篇论文： [LG] Self-CTRL: Self-Consistency Training with Reinforcement Learning [MIT CSAIL] https://arxiv.org/abs/2606.18327 --- [LG] Private Learning with Public Feature Conditioning [AWS Agentic AI & Microsoft & Google Research] https://arxiv.org/abs/2606.18773 --- [LG] STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability [Tencent Hunyuan & Tsinghua University] https://arxiv.org/abs/2606.19236 --- [RO] Do as I Do: Dexterous Manipulation Data from Everyday Human Videos [UC Berkeley] https://arxiv.org/abs/2606.19333 --- [LG] Explaining Attention with Program Synthesis [NJIT & MIT EECS] https://arxiv.org/abs/2606.19317

[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

今天我们要聊点特别的，看看科学家们是如何用一些生活中的大智慧，来教AI学得更聪明。我们会探索四篇最新论文，看看如何给AI配一个靠谱的“数学翻译官”，让它不再胡说八道；又如何像一位金牌私教，通过“错题本”和“二选一”来因材施教。接着，我们会揭秘一种神奇的“反向学习法”，让AI通过观察就能比老师做得更好；最后，我们还会聊聊为什么给大模型一个“沙漏身材”，会比传统的“水桶身材”更高效。准备好了吗？让我们一起出发！ 00:00:36 给AI装一个靠谱的数学翻译官 00:05:03 AI界的“因材施教”，如何让小模型学得更聪明？ 00:10:32 如何让机器“反向”学习，变得比老师更聪明？ 00:16:08 只看结果，你可能错过了真正的第一名 00:22:15 AI大模型的新身材，为什么“沙漏”比“水桶”好？本期介绍的几篇论文： [LG] Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics [University of Washington] https://arxiv.org/abs/2606.17581 --- [CL] Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients [NVIDIA] https://arxiv.org/abs/2606.18216 --- [LG] Reversal Q-Learning [UC Berkeley] https://arxiv.org/abs/2606.17551 --- [LG] Offline Preference-Based Trajectory Evaluation [CMU] https://arxiv.org/abs/2606.17541 --- [CL] Variable-Width Transformers [MIT] https://arxiv.org/abs/2606.18246

93