AI可可AI生活 - 节目列表

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

AI可可AI生活

你是否感觉努力到一定阶段就会遭遇瓶颈,或者在海量信息中难以抉择?本期我们要聊的几篇最新论文,就揭示了AI如何用更聪明的策略解决这些难题。我们将看到,机器不仅学会了在优化的“峡谷”中奋力一跃,还掌握了从招聘到投资都通用的决策“万能公式”。更有趣的是,AI已经开始懂得“吃一堑长一智”,甚至能在训练的最后一百米,像顶尖运动员一样进行科学冲刺。 00:00:33 从龟速到全速,如何跳出优化的“平庸峡谷” 00:05:48 决策的万能公式 00:11:30 高手过招,如何在信息爆炸中做出聪明选择? 00:17:42 为什么你家的扫地机器人总像个“笨蛋”? 00:24:16 AI冲刺的最后一百米,怎么跑才最快? 本期介绍的几篇论文: [LG] Local linear convergence of gradient methods for overparameterized Gaussian mixtures [University of Washington] https://arxiv.org/abs/2605.30936 --- [LG] Universal Decision Learners [Adobe Research] https://arxiv.org/abs/2605.30694 --- [LG] Hedging on the Frontier: Learning New Tasks with Few Samples [ETH Zurich & UC San Diego] https://arxiv.org/abs/2605.30997 --- [RO] Don't Fool Me Twice: Adapting to Adversity in the Wild with Experience-Driven Reasoning [Indian Institute of Technology & CMU] https://arxiv.org/abs/2605.31119 --- [CL] Towards Efficient LLMs Annealing with Principled Sample Selection [Microsoft Research Asia] https://arxiv.org/abs/2605.31175

30分钟
99+
3周前
[人人能懂AI前沿] AI在想什么?当它学会遗忘、看见趋势、认识自己

[人人能懂AI前沿] AI在想什么?当它学会遗忘、看见趋势、认识自己

AI可可AI生活

我们总希望AI更聪明,但如果我说,一篇最新论文发现,一个更“健忘”的AI反而对我们更有用呢?本期,我们将一起窥探AI的“内心世界”:看看一个短暂领悟了世界几何结构、又旋即忘却的AI,是如何思考的;一个不再满足于“平均”,而是学会了看“趋势”的AI,又是如何进化的。我们甚至还会聊聊,AI是不是已经有了区分“我”和“非我”的原始意识。准备好了吗?让我们一起出发,探索AI思考的奇妙新维度。 00:00:41 AI那么强,为什么我们偏要给它装上一个“健忘”的大脑? 00:06:30 AI的“七情六欲”,一个转瞬即逝的秘密 00:13:08 换个姿势,AI还能变得更聪明? 00:18:31 AI学会了“算”,但它学会“想”了吗? 00:24:25 AI的自我意识,它知道哪句话是自己说的吗? 本期介绍的几篇论文: [CL] Simulating Human Memory with Language Models [NYU] https://arxiv.org/abs/2605.25680 --- [AI] Geometry of Human Perceptual Domains Emerges Transiently in LLM Representations [Indian Institute of Technology Roorkee & Lossfunk] https://arxiv.org/abs/2605.27970 --- [LG] Parallax: Parameterized Local Linear Attention for Language Modeling [Northwestern University & Tilde Research & University of Washington] https://arxiv.org/abs/2605.29157 --- [LG] DiscoverPhysics: Benchmarking LLMs for Out-of-the-Box Scientific Thinking [Princeton University] https://arxiv.org/abs/2605.26087 --- [LG] From Simulation to Enaction: Post-trained language models recognize and react to their own generations [Institute for Advanced Study & Anthropic] https://arxiv.org/abs/2605.25459

32分钟
99+
3周前
[人人能懂AI前沿] AI进化启示录:当机器学会睡眠、自省与左右互搏

[人人能懂AI前沿] AI进化启示录:当机器学会睡眠、自省与左右互搏

AI可可AI生活

这一期,我们将一起探索AI匪夷所思的成长秘诀:为什么让AI“睡一觉”反而能让它更会思考?我们会看到,AI如何像武林高手一样,既能“左右互搏”创造新招式,又能“内外双修”实现自我进化。同时,我们还会揭秘AI对抗“灾难性遗忘”的巧妙方法,以及一个“通用大脑”是如何让所有机器人都学会举一反三的。 00:00:31 让人工智能“睡一觉”,它为什么就变聪明了? 00:05:06 AI精进的秘密,一只手调整装备,一只手修炼内功 00:12:19 为什么学得越多,忘得越快?AI给了个新解法 00:19:03 如何让机器人学会“举一反三”? 00:25:06 AI进化论,如何让机器学会“左右互搏”? 本期介绍的几篇论文: [CL] Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference [CMU & University of Maryland] https://arxiv.org/abs/2605.26099 --- [CL] SIA: Self Improving AI with Harness & Weight Updates [Hexo Labs] https://arxiv.org/abs/2605.27276 --- [LG] Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay [New York University] https://arxiv.org/abs/2605.26097 --- [RO] Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [Qwen Team] https://arxiv.org/abs/2605.30280 --- [CL] Self-Improving Language Models with Bidirectional Evolutionary Search [Harvard University & MIT] https://arxiv.org/abs/2605.28814

31分钟
99+
4周前
[人人能懂AI前沿] 信号、记忆与野性:解锁AI黑箱的三把钥匙

[人人能懂AI前沿] 信号、记忆与野性:解锁AI黑箱的三把钥匙

AI可可AI生活

你有没有想过,当AI学会了耍心机,我们怎么才能看穿它的伪装?最新论文带来了一把钥匙:给AI做个“脑CT”,直接定位它脑中的“坏心思”和“好创意”。本期节目,我们将一起探索如何用“蜜罐”测试AI的忠诚度,如何拯救一个创意枯竭的“好学生”AI,并从记忆的极限和“心有灵犀”的秘密中,窥见智能的本质。准备好了吗?让我们即刻出发! 00:00:33 如果AI学会了“耍心机”,我们怎么才能发现? 00:07:28 我们能给AI做个“脑CT”吗? 00:12:23 如何拯救一个“无聊”的好学生? 00:16:34 你的记忆力,正在如何塑造你的学习天花板? 00:23:42 AI心有灵犀的秘密,藏在一根“直线”里 本期介绍的几篇论文: [LG] Realistic honeypot evaluations for scheming propensity [Google DeepMind] https://arxiv.org/abs/2605.29729 --- [AI] Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet [Anthropic] https://arxiv.org/abs/2605.29358 --- [CL] Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [University of Maryland] https://arxiv.org/abs/2605.30021 --- [CL] On Language Generation in the Limit with Bounded Memory [Cornell University & Stanford University] https://arxiv.org/abs/2605.30324 --- [LG] Representation Alignment Rests on Linear Structure [MIT] https://arxiv.org/abs/2605.28870

31分钟
99+
4周前
[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

AI可可AI生活

想知道AI如何学会“看眼色”举一反三吗?本期,我们将一起揭秘几篇最新论文,看看AI如何像有了“变速箱”一样动态切换快慢刀,又如何通过“智能菜谱”让机器人学会干活。我们还会聊聊如何给AI一张“认知体检表”来衡量它的真实水平,以及它那套偷偷学会的“省钱”妙招。准备好了吗?让我们一探究竟! 00:00:34 AI如何学会“看眼色”,一个关于举一反三的发现 00:05:43 机器人后空翻都会,为什么还不会端茶倒水? 00:11:28 AI的“变速箱”,什么时候该用牛刀? 00:17:29 给AI一张体检表,我们离通用人工智能还有多远? 00:23:00 你的AI,正在偷偷学会“省钱” 本期介绍的几篇论文: [LG] Fine-Tuning Dynamics of In-Context Factual Recall in Transformers [Duke University & Princeton University & UC Berkeley] https://arxiv.org/abs/2605.27774 --- [RO] HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning [NVIDIA] https://arxiv.org/abs/2605.27724 --- [LG] Multi-Mixer Models: Flexible Sequence Modeling with Shared Representations [CMU & Google Research] https://arxiv.org/abs/2605.28769 --- [AI] Measuring Progress Toward AGI: A Cognitive Framework [Google DeepMind] https://arxiv.org/abs/2605.28405 --- [LG] Meta-Attention: Bayesian Per-Token Routing for Efficient Transformer Inference [Knowledge Lab AG] https://arxiv.org/abs/2605.28384

28分钟
99+
4周前
[人人能懂AI前沿] 世界模型、自我蒸馏、缩放法则、证据链与专家混合

[人人能懂AI前沿] 世界模型、自我蒸馏、缩放法则、证据链与专家混合

AI可可AI生活

你有没有想过,一个AI要怎样才能真正“看懂”世界,而不是假装看懂?本期节目,我们将从一篇最新论文出发,揭示一个简单的“高斯沙堆”如何帮助AI解开世界的本质。紧接着,我们会看到AI如何像武林高手一样“左右互搏”,在没有老师的情况下实现自我进化。然后,我们将探索一个能预测AI未来的“万能公式”,并直面AI的“诚信危机”,看看如何用一条“证据链”让它变得可信。最后,我们会发现,为了让你的手机变得更聪明,AI正在悄悄组建一个“专家委员会”。 00:00:42 想让AI看懂世界?你只需要一个高斯分布 00:06:30 不用老师,AI怎么自己考上大学? 00:12:21 增长的“万能公式”,如何科学地预测你的下一步? 00:19:27 AI的诚信危机,我们如何相信一个“超级大脑”? 00:25:58 你的手机,为什么要养一个“专家委员会”? 本期介绍的几篇论文: [LG] When Does LeJEPA Learn a World Model? [Cold Spring Harbor Laboratory & New York University & Brown University] https://arxiv.org/abs/2605.26379 --- [CL] Self-Verified Distillation: Your Language Model Is Secretly Its Own Synthetic Data Pipeline [Stanford University] https://arxiv.org/abs/2605.26132 --- [LG] Unified Neural Scaling Laws [Mila, University of Montreal & Google DeepMind] https://arxiv.org/abs/2605.26248 --- [AI] ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence [Google Cloud AI Research] https://arxiv.org/abs/2605.26340 --- [LG] MobileMoE: Scaling On-Device Mixture of Experts [Meta AI] https://arxiv.org/abs/2605.27358

34分钟
99+
1个月前
[人人能懂AI前沿] 从AI助教、因果科学到稀疏革命

[人人能懂AI前沿] 从AI助教、因果科学到稀疏革命

AI可可AI生活

你有没有想过,AI不仅能成为拉平世界教育鸿沟的“私教”,还能化身为你专属的“出题官”?这一期,我们将一起探索几篇有趣的最新论文,看看AI是如何从一个“大力出奇迹”的炼丹师,进化为懂得因果科学的工程师。我们还会揭示一个惊人发现:高效的AI可能一直在“假装”认真阅读,而我们用来测试它速度的秒表,甚至可能一直在“欺骗”我们! 00:00:32 你的AI私教,正在悄悄拉平世界 00:06:58 想造好AI?可能得先补上这门“因果课” 00:12:42 AI读长文太慢?也许它一直在“假装”认真 00:18:28 你的私人出题官,是怎么炼成的? 00:23:55 你的AI有多快?小心,你的秒表可能在骗你 本期介绍的几篇论文: [AI] Human-AI Collaboration in Science at Scale: A Global Large-scale Randomized Field Experiment [Northwestern Universit & Stanford University] https://arxiv.org/abs/2605.24180 --- [LG] Causal methods for LLM development and evaluation [MCML & CMU] https://arxiv.org/abs/2605.25998 --- [LG] Inference Time Context Sparsity: Illusion or Opportunity? [Rice University & UC Berkeley] https://arxiv.org/abs/2605.24168 --- [AI] KT4EQG: Personalized Exercise Question Generation via Knowledge Tracing [University of California, Santa Barbara & University of South Alabama] https://arxiv.org/abs/2605.23933 --- [AI] Identifying and Mitigating Systemic Measurement Bias in Production LLM Inference Benchmarks [Google] https://arxiv.org/abs/2605.24217

29分钟
99+
1个月前
[人人能懂AI前沿] 从信噪比、凸优化到底线思维:重塑AI的五个底层逻辑

[人人能懂AI前沿] 从信噪比、凸优化到底线思维:重塑AI的五个底层逻辑

AI可可AI生活

你有没有想过,为什么AI会越练越笨,甚至被人类“算计”?本期节目,我们将一口气解锁五篇最新论文带来的颠覆性思考:从用香农定律解释AI的“U型学习曲线”,到仅用一块显卡就能“调教”出听话的大模型;从赋予AI“底线思维”来应对未知风险,到让它写出“绝对正确”的关键代码;最后,我们还会看到AI如何从“看图识字”进化到真正“读懂规矩”。准备好,一场关于AI思维升级的风暴即将来临! 00:00:37 你的模型为什么越练越笨? 00:07:11 AI大模型调教指南,如何用一块显卡搞定? 00:12:44 面对“深不可测”的世界,AI如何做出明智选择? 00:18:45 AI开始写“绝对正确”的代码了 00:23:43 AI的新玩法,从“看图识字”到“读懂规矩” 本期介绍的几篇论文: [LG] LLMs as Noisy Channels: A Shannon Perspective on Model Capacity and Scaling Laws [ByteDance Seed] https://arxiv.org/abs/2605.23901 --- [LG] Convex Optimization for Alignment and Preference Learning on a Single GPU [Stanford University] https://arxiv.org/abs/2605.23244 --- [LG] Infra-Bayesian Reinforcement Learning Agents Outperform Classical RL For Worst-Case Robustness [Purdue University & CMU & WorldQuant University] https://arxiv.org/abs/2605.23146 --- [AI] Inductive Deductive Synthesis: Enabling AI to Generate Formally Verified Systems [UC Berkeley] https://arxiv.org/abs/2605.23109 --- [CV] General Hazard Detection [Swinburne University of Technology] https://arxiv.org/abs/2605.23304

30分钟
99+
1个月前
[人人能懂AI前沿] AI变聪明的捷径:给它后悔药、世界地图和一位好陪练

[人人能懂AI前沿] AI变聪明的捷径:给它后悔药、世界地图和一位好陪练

AI可可AI生活

想让AI变聪明,一定要把它做得更大、训练得更久吗?最新论文告诉我们,恰恰相反!今天我们要聊聊,如何通过为AI“挖一口深井”来代替疯狂“堆料”,如何给它一颗“后悔药”让小模型也能超越巨无霸。我们还会揭秘AI训练的“快进键”是如何实现的,以及如何给AI一份“世界地图”和一位“高手陪练”,让它拥有永不枯竭的好奇心和可被预测的光明未来。 00:00:35 人工智能“开窍”的秘密,与其堆料,不如挖井 00:05:53 给机器一颗“后悔药”,小模型如何反超大模型? 00:12:02 AI训练的“快进键”,为什么只练开头就能猜到结尾? 00:17:12 AI“路痴”自救指南,如何拥有永不枯竭的好奇心 00:23:16 AI养成记,如何给一个“笨”模型当好陪练? 本期介绍的几篇论文: [LG] Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning [CMU] https://arxiv.org/abs/2605.21488 --- [AI] Probabilistic Tiny Recursive Model [Mila – Quebec AI Institute] https://arxiv.org/abs/2605.19943 --- [LG] You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories [University of Virginia] https://arxiv.org/abs/2605.21468 --- [LG] Remember to be Curious: Episodic Context and Persistent Worlds for 3D Exploration [University of Toronto & UC Berkeley & Wayve] https://arxiv.org/abs/2605.22814 --- [CL] Forecasting Downstream Performance of LLMs With Proxy Metrics [Mila – Quebec AI Institute & McGill University] https://arxiv.org/abs/2605.18607

30分钟
99+
1个月前
[人人能懂AI前沿] AI的思考艺术:从深度循环、多维罗盘到概率分身

[人人能懂AI前沿] AI的思考艺术:从深度循环、多维罗盘到概率分身

AI可可AI生活

你有没有想过,AI变聪明,除了靠“大力出奇迹”的蛮力,还能不能靠“四两拨千斤”的巧劲?本期节目,我们将一起探寻几篇最新论文带来的奇妙思路:看AI如何用更精巧的大脑结构深度思考,如何拥有一把防止跑偏的多维度“罗盘”,又如何像我们一样分身“脑暴”探索多种可能。我们甚至会看到,AI如何学会“过日子”,成为一个既懂创作又懂节约的默契搭档,这一切,都要从一块小小的玻璃说起。 00:00:37 AI新物种,有一种聪明,不是靠“蛮力” 00:06:37 AI对齐的“罗盘”,如何让模型不跑偏? 00:12:44 不想只走一条路?AI的“概率性思考”新玩法 00:17:59 鱼和熊掌,计算机如何看清一块玻璃? 00:22:33 你的音乐搭档,不止会创作,更会“过日子” 本期介绍的几篇论文: [CL] HRM-Text: Efficient Pretraining Beyond Scaling [Sapient Intelligence & MIT] https://arxiv.org/abs/2605.20613 --- [LG] General Preference Reinforcement Learning [Stanford University & The University of Oklahoma] https://arxiv.org/abs/2605.18721 --- [AI] Generative Recursive Reasoning [KAIST] https://arxiv.org/abs/2605.19376 --- [CV] RT-Splatting: Joint Reflection-Transmission Modeling with Gaussian Splatting [Peking University] https://arxiv.org/abs/2605.18263 --- [AS] Stable Audio 3 [Stability AI] https://arxiv.org/abs/2605.17991

30分钟
99+
1个月前
[人人能懂AI前沿] AI如何思考?偷师、烧脑与画地图的艺术

[人人能懂AI前沿] AI如何思考?偷师、烧脑与画地图的艺术

AI可可AI生活

你有没有想过,一个更聪明的AI,也许并不需要更大的体量,而是需要更精巧的设计?本期节目,我们将从五篇最新论文出发,揭示AI智慧的内部运作:看AI如何为自己的记忆装上独立的“铅笔和橡皮”;又是如何像系着安全绳的“醉汉”一样,去挑战顶尖的数学难题。我们还会探讨AI如何拥有一个“大脑CEO”来决定何时“烧脑”,以及在一场模型间的“偷师”攻防战中,如何才能守住核心秘籍。最后,你会发现,原来喂给AI的第一张“地图”,就早已决定了它能看多远。 00:00:42 AI的记忆难题,一支笔和一个橡皮擦 00:06:17 AI当助教,数学家离“下岗”还有多远? 00:11:55 你的大脑,如何决定何时“烧脑”? 00:16:46 聪明人是如何“偷”老师的武功秘籍的? 00:23:15 喂给AI的“地图”,决定了它能看多远 本期介绍的几篇论文: [LG] Gated DeltaNet-2: Decoupling Erase and Write in Linear Attention [NVIDIA] https://arxiv.org/abs/2605.22791 --- [AI] Advancing Mathematics Research with AI-Driven Formal Proof Search [Google DeepMind] https://arxiv.org/abs/2605.22763 --- [CL] Efficient Agentic Reasoning Through Self-Regulated Simulative Planning [Institute of Foundation Models (IFM) & CMU] https://arxiv.org/abs/2605.22138 --- [LG] The Distillation Game: Adaptive Attacks & Efficient Defenses [Stanford University & Toyota Technological Institute at Chicago] https://arxiv.org/abs/2605.22737 --- [LG] Lost in Tokenization: Fundamental Trade-offs in Graph Tokenization for Transformers [Meta AI & New York University & Harvard University] https://arxiv.org/abs/2605.22471

30分钟
99+
1个月前
[人人能懂AI前沿] AI如何加速科学、欺骗我们、又最终懂你?

[人人能懂AI前沿] AI如何加速科学、欺骗我们、又最终懂你?

AI可可AI生活

你有没有想过,一个AI不仅能成为科学家的“超级大脑”,还能像人一样“反思”自己学得好不好?本期节目,我们将从五篇最新的AI论文出发,揭秘AI如何通过“人机协作”加速科学发现,却又可能因为追求“差不多”而酿成大错;同时我们也会探讨,为何你请的AI“演员”可能演着演着就换了人,以及我们最终如何才能让AI调配出一碗最懂你的“光谱靓汤”。00:00:33 给牛顿一个AI,科学会快多少?00:07:11 AI训练场上的“反思怪”,一条更聪明的成长路径00:12:36 AI的“差不多”,为什么会酿成大错?00:18:28 为什么你请的AI“演员”,可能演着演着就换人了?00:25:25 想让AI懂你?试试给它煲一锅“光谱靓汤”本期介绍的几篇论文:[AI] A multi-agent system for automating scientific discovery [FutureHouse] https://www.nature.com/articles/s41586-026-10652-y ---[LG] Introspective X Training: Feedback Conditioning Improves Scaling Across all LLM Training Stages [NVIDIA] https://arxiv.org/abs/2605.20285 ---[LG] Mechanisms of Misgeneralization in Physical Sequence Modeling [Harvard College & Microsoft & Comcast AI] https://arxiv.org/abs/2605.20299 ---[CL] The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study [Google DeepMind] https://arxiv.org/abs/2605.20767 ---[LG] Spectral Souping: A Unified Framework for Online Preference Alignment [Google DeepMind & Google Research] https://arxiv.org/abs/2605.20408 在小宇宙查看该单集文稿

31分钟
0
1个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧