节目列表: AI可可AI生活 - EarsOnMe - 精选播客，一听即合

[人人能懂AI前沿] AI的成长三部曲：金牌教练、乐高大师与风光摄影师

你有没有想过，AI如何像我们一样，在反复试错后找到“刚刚好”的平衡点？这一期，我们就从几篇最新的AI论文出发，聊聊AI的“智慧进化”：看它如何学会给自己配备一个“后悔调节器”来动态调整策略，如何通过带“复盘笔记”的刻意练习，从沟通“小白”进化成“流程大师”，以及如何像拼乐高一样，用聪明的设计给自己“瘦身”，最终实现速度与质量的完美飞跃。00:00:31 做对选择，你需要一个“后悔调节器”00:05:28 AI 进化论，如何让一个聪明的“员工”，听懂“人话”？00:11:15 面对海量选择，我们如何做出“刚刚好”的聪明决策？00:19:09 AI作画提速的秘密，多看一步，不止平均00:24:26 神经网络的大瘦身，为什么聪明的设计胜过蛮力计算？本期介绍的几篇论文：[LG] Efficient Online Conformal Selection with Limited Feedback[Google Research & Duke University]https://arxiv.org/abs/2605.14953 ---[LG] Prompting Policies for Multi-step Reasoning and Tool-Use in Black-box LLMs with Iterative Distillation of Experience[Google Research]https://arxiv.org/abs/2605.14443 ---[LG] Stochastic Matching via Local Sparsification[Google Research]https://arxiv.org/abs/2605.14195 ---[LG] Covariance-aware sampling for Diffusion Models[Google]https://arxiv.org/abs/2605.13910 ---[LG] Compositional Sparsity as an Inductive Bias for Neural Architecture Design[University College London]https://arxiv.org/abs/2605.14764 在小宇宙查看该单集文稿

30分钟

99+

1个月前

[人人能懂AI前沿] AI的雕塑家、守门员与博弈论

AI可可AI生活

你有没有想过，AI写文章不靠“串珠子”，而是像雕塑家一样从混沌中“凿”出杰作？为什么把两个最先进的技术组合，反而会得到一个最差的结果？本期节目，我们将一起探讨几篇最新论文，看看AI如何像一个聪明的团队，在网上冲浪却不“学坏”；如何在与人类“上有政策，下有对策”的博弈中保持学习能力；以及它如何像一个决策守门员，把宝贵的精力只花在最值得的探索上。00:00:32 AI写作新思路，像雕塑家一样“凿”出好文章00:05:19 AI的“阅读”困境，该读字，还是读字母？00:11:41 你的“最强大脑”，差的不是智商，而是搜索方法00:17:05 AI时代的“上有政策，下有对策”00:22:37 决策的“守门员”，如何把精力花在刀刃上本期介绍的几篇论文：[CL] ELF: Embedded Language Flows [MIT] https://arxiv.org/abs/2605.10938 ---[LG] The Efficiency Gap in Byte Modeling [Google DeepMind] https://arxiv.org/abs/2605.12928 ---[CL] Context Training with Active Information Seeking [Google DeepMind] https://arxiv.org/abs/2605.13050 ---[LG] Strategic PAC Learnability via Geometric Definability [Technion – Israel Institute of Technology] https://arxiv.org/abs/2605.13426 ---[LG] Delightful Exploration [Google DeepMind] https://arxiv.org/abs/2605.13287 在小宇宙查看该单集文稿

28分钟

99+

1个月前

[人人能懂AI前沿] AI的内功、表演与成长法则

AI可可AI生活

这一期，我们来聊聊几个特别有意思的“AI悖论”：想让AI团队更强，是该招“通才”还是“专才”？AI写下的思考步骤，究竟是真实的内心独白，还是为了让你满意的“事后表演”？而教一个AI“学生”，是让他抄答案更有效，还是抄解题思路更靠谱？几篇最新的论文，给了我们一些出乎意料的答案。00:00:27 人多力量大，还是术业有专攻？00:07:33 AI的“胎记”，我们如何给机器生成的内容盖个章？00:12:46 AI训练的快慢之争，一个两全其美的方案00:18:35 你的AI队友，是在真思考还是在“演”给你看？00:23:52 让AI“小号”变聪明的秘密，抄答案还是抄思路？本期介绍的几篇论文：[LG] Slicing and Dicing: Configuring Optimal Mixtures of Experts [University of Washington & New York University] https://arxiv.org/abs/2605.11689 ---[LG] TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection [Meta Superintelligence Labs] https://arxiv.org/abs/2605.12456 ---[LG] Learning, Fast and Slow: Towards LLMs That Adapt Continually [UC Berkeley & Mila] https://arxiv.org/abs/2605.12484 ---[LG] When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel [CMU & Fujitsu Research of America Inc] https://arxiv.org/abs/2605.11746 ---[CL] A Study on Hidden Layer Distillation for Large Language Model Pre-Training [Google DeepMind] https://arxiv.org/abs/2605.11513 在小宇宙查看该单集文稿

30分钟

99+

1个月前

[人人能懂AI前沿] AI的学霸秘籍、省钱妙计与陪练手册

AI可可AI生活

你有没有想过，AI也会有“选择困难症”吗？或者，怎么才能给AI请个既省钱又能干的“陪练”？这一期，我们就来聊聊几篇有趣的最新论文，看看科学家们是如何教会AI像高手一样反思、像侦探一样倾听“沉默的投票”，甚至用中学物理知识，给AI装上一双“3D眼睛”的。准备好了吗？让我们一起出发！00:00:29 鸡娃不如“陪练”，AI训练的降本增效新思路00:05:53 AI的学霸秘籍，如何像高手一样思考和进化00:12:12 AI的阅读术，如何既快又好地啃下海量信息？00:18:24 AI的“过分自信”，原来是种“选择困难症”00:23:39 让AI拥有“立体视觉”的省钱妙计本期介绍的几篇论文：[LG] CoDistill-GRPO: A Co-Distillation Recipe for Efficient Group Relative Policy Optimization [Google Research] https://arxiv.org/abs/2605.08873 ---[CL] RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards [Google Cloud AI Research] https://arxiv.org/abs/2605.10899 ---[CL] Scratchpad Patching: Decoupling Compute from Patch Size in Byte-Level Language Models [Google DeepMind] https://arxiv.org/abs/2605.09630 ---[CL] The Silent Vote: Improving Zero-Shot LLM Reliability by Aggregating Semantic Neighborhoods [Google] https://arxiv.org/abs/2605.09739 ---[LG] RelFlexformer: Efficient Attention 3D-Transformers for Integrable Relative Positional Encodings [Seoul National University & Google Research] https://arxiv.org/abs/2605.10706 在小宇宙查看该单集文稿

29分钟

99+

1个月前

[人人能懂AI前沿] 从聪明花钱、英雄涌现到AI的“偏科”报告

AI可可AI生活

今天我们要聊点特别有意思的话题：AI是怎么“思考”和“成长”的？我们会从几篇最新的论文出发，看看AI如何学会聪明地“花钱”，如何在学习中分清“英雄”与“集体”；然后，我们会揭秘它那套先打“草稿”再复核的高效工作法。最后，我们会用一把全新的“尺子”去度量它成长的极限，并给它做一份“智商测试”，看看这个“天才”到底偏科有多严重。准备好了吗？让我们一起潜入AI的大脑深处。00:00:33 如何打造一个“更划算”的虚拟世界？00:06:10 大模型的“缩放法则”里，藏着什么秘密？00:13:40 快与慢，AI世界里的“草稿式”工作法00:19:55 你的数据值多少钱？一个新尺子，看透AI的增长极限00:26:42 AI的“智商”报告，一个偏科天才的养成本期介绍的几篇论文：[LG] On Training in Imagination [Weizmann Institute of Science & New York University & Columbia University] https://arxiv.org/abs/2605.06732 ---[LG] Spectral Dynamics in Deep Networks: Feature Learning, Outlier Escape, and Learning Rate Transfer [Harvard University] https://arxiv.org/abs/2605.07870 ---[CL] Fast Byte Latent Transformer [FAIR at Meta] https://arxiv.org/abs/2605.08044 ---[LG] On the Invariance and Generality of Neural Scaling Laws [Johns Hopkins University & MIT] https://arxiv.org/abs/2605.07546 ---[AI] Uneven Evolution of Cognition Across Generations of Generative AI Models [Google DeepMind & Google Research] https://arxiv.org/abs/2605.06815 在小宇宙查看该单集文稿

33分钟

99+

1个月前

[人人能懂AI前沿] 从追问、拆解到打腹稿：AI正在升级“思考”的操作系统

AI可可AI生活

你有没有想过，一个真正聪明的AI，应该具备哪些超越“有问必答”的能力？本期节目，我们将通过几篇最新的AI论文，一探究竟。我们将看到，AI如何从一个被动的知识库，进化成一个懂得“追问”的医生，以及一个会“打腹稿”的作家。我们还会揭示，AI如何学会把“登天”的难题拆解成“上楼”和“坐电梯”，又是如何通过一个“记忆外挂”实现过目不忘的。准备好了吗？让我们一起刷新对AI“思考能力”的认知！00:00:34 AI看病，真正厉害的不是“诊断”而是“追问”00:06:35 把“登天”的难题，拆解成“上楼”和“坐电梯”00:11:52 AI开口说话，非得“一句接一句”吗？00:16:47 面对海量数据，我们如何看清那只“看不见的手”？00:23:46 AI的“记忆外挂”，如何让它过目不忘？本期介绍的几篇论文：[AI] SymptomAI: Towards a Conversational AI Agent for Everyday Symptom Assessment [Google Research] https://arxiv.org/abs/2605.04012 ---[LG] Conditional Diffusion Sampling [University of Cambridge & University of Granada & University of British Columbia] https://arxiv.org/abs/2605.04013 ---[CL] Continuous Latent Diffusion Language Model [Bytedance Seed] https://arxiv.org/abs/2605.06548 ---[LG] High-Dimensional Statistics: Reflections on Progress and Open Problems [Columbia University & Harvard University & CMU] https://arxiv.org/abs/2605.05076 ---[CL] TIDE: Every Layer Knows the Token Beneath the Context [Apple] https://arxiv.org/abs/2605.06216 在小宇宙查看该单集文稿

30分钟

99+

1个月前

[人人能懂AI前沿] 给AI“减肥”、“立人设”和“夸到点子上”，需要几步？

AI可可AI生活

你有没有想过，最简单的数学平均值，竟然能打败最复杂的压缩算法？或者，在教AI“做什么”之前，我们其实可以先给它“喂”一套完整的思想和人设？本期节目，我们将从四篇最新的AI论文出发，一起探寻如何让AI自己长出可拆分的“乐高模块”，以及如何像一位顶级名师那样，把奖励精准地“夸”到AI的灵光一闪之处。00:00:29 你的记忆能被压缩多少，藏在一个几何定律里00:06:42 训练AI，从“喂”指令到“喂”思想00:11:47 AI减肥记，如何让一个大模型只带“脑子”出门？00:17:54 AI也需要“夸到点子上”？本期介绍的几篇论文：[LG] The Geometry of Consolidation A Bharadwaj Vangara, A Gopinath https://github.com/niashwin/geometry-of-consolidation/blob/main/paper/arxiv/main.pdf ---[AI] Model Spec Midtraining: Improving How Alignment Training Generalizes C Li, S Price, S Marks, J Kutasov https://arxiv.org/abs/2605.02087 ---[CL] EMO: Pretraining Mixture of Experts for Emergent Modularity R Wang, A Bhagia, S Min https://arxiv.org/abs/2605.06663 ---[LG] DGPO: Distribution Guided Policy Optimization for Fine Grained Credit Assignment H Jin, R Zhu, Z Du, X Jiang… https://arxiv.org/abs/2605.03327 在小宇宙查看该单集文稿

23分钟

99+

1个月前

[人人能懂AI前沿] 从记忆宫殿、技能进化到创作的本质

AI可可AI生活

你有没有想过，我们能不能唤醒AI沉睡的“内在记忆”，而不是给它外挂一个搜索引擎？如何让健忘的AI真正“吃一堑，长一智”，把经验变成可复用的技能？本期节目，我们将从最新的几篇论文出发，探讨AI如何从一个“答题工具”进化成一个能自我迭代、甚至与我们并肩探索的“成长型伙伴”。00:00:26 给AI配个“助理”？这可能是个馊主意00:06:10 让AI开窍，如何把“经验”变成“能力”？00:11:18 AI画家是天才，还是复印机？00:17:25 AI的新玩法，从“解题”到“陪跑”00:23:43 你以为的“神来之笔”，可能只是个“生僻字”？本期介绍的几篇论文：[LG] Retrieval from Within: An Intrinsic Capability of Attention-Based Models [NVIDIA] https://arxiv.org/abs/2605.05806 ---[LG] SkillOS: Learning Skill Curation for Self-Evolving Agents [University of Illinois Urbana-Champaign & Google Cloud AI Research] https://arxiv.org/abs/2605.06614 ---[LG] Understanding diffusion models requires rethinking (again) generalization [PSL Research University & Sorbonne University] https://arxiv.org/abs/2605.06077 ---[AI] AI Co-Mathematician: Accelerating Mathematicians with Agentic AI [Google DeepMind] https://arxiv.org/abs/2605.06651 ---[CL] The Frequency Confound in Language-Model Surprisal and Metaphor Novelty [Bielefeld University] https://arxiv.org/abs/2605.06506 在小宇宙查看该单集文稿

29分钟

99+

1个月前

[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈

AI可可AI生活

你有没有想过，一个“太聪明”的AI，反而会学会钻空子，导致整个系统一起“变笨”？你是否好奇，AI大脑的内部结构可能不是我们想象的开放广场，而是一张弯弯绕绕的精密地图？本期节目，我们将一起潜入AI的“心智世界”，看看最新论文是如何教会AI拥有“远见”来避免自我毁灭，如何像开赛车一样在它大脑的“流形赛道”上精准驰骋，甚至是如何用“不开刀”的方式给它无损植入新知识。更重要的是，我们会发现，原来给AI提建议和给它参考资料，都可能是在“越帮越忙”。准备好了吗？让我们一起挑战关于AI的四个“想当然”。00:00:45 当AI学会了钻空子，我们如何防止它“聪明反被聪明误”？00:06:20 AI的“脑回路”长啥样？我们可能一直都搞错了00:10:56 AI升级难题，一个“不开刀”的手术方案00:16:04 为什么夸人“你真棒”是最低效的鼓励？00:20:33 给AI帮忙，为何会越帮越忙？本期介绍的几篇论文：[LG] Explaining and Preventing Alignment Collapse in Iterative RLHF [PSL Research University] https://arxiv.org/abs/2605.04266 ---[LG] Manifold Steering Reveals the Shared Geometry of Neural Network Representation and Behavior [GOODFIRE] https://arxiv.org/abs/2605.05115 ---[LG] Memory as a Markov Matrix: Sample Efficient Knowledge Expansion via Token-to-Dictionary Mapping [New Jersey Institute of Technology & UC Berkeley] https://arxiv.org/abs/2605.04308 ---[LG] Efficiently Aligning Language Models with Online Natural Language Feedback [Stanford University & Anthropic] https://arxiv.org/abs/2605.04356 ---[LG] When Context Hurts: The Crossover Effect of Knowledge Transfer on Multi-Agent Design Exploration [Meta] https://arxiv.org/abs/2605.04361 在小宇宙查看该单集文稿

27分钟

99+

1个月前

[人人能懂AI前沿] AI的学霸笔记、建筑师思维与自我进化

AI可可AI生活

想让AI学会推理，是给它一本百科全书，还是塞给它一张“学霸的草稿纸”？最新论文说，看别人怎么思考，比死记硬背更管用。我们还会一起探索，AI离“独立盖起一栋楼”般的复杂工程到底还有多远，并用“脑回路CT”技术，看看你的AI管家为什么有时会“一本正经地胡说八道”。更有趣的是，我们将揭秘AI如何通过自我反思，从“差生”逆袭成“学霸”，以及如何靠一个“探测器”就画出整张看不见的“藏宝图”。准备好了吗？我们马上出发！00:00:37 AI也需要“学霸笔记”吗？00:05:42 AI离“独立盖起一栋楼”还有多远？00:10:46 你的AI管家，为什么有时“一本正经地胡说八道”？00:16:33 如何用AI画一张看不见的藏宝图？00:21:30 AI的自我修炼，从“差生”到“学霸”的秘密[IR] RAG over Thinking Traces Can Improve Reasoning Tasks [UC Berkeley] https://arxiv.org/abs/2605.03344 ---[AI] ProgramBench: Can Language Models Rebuild Programs From Scratch? [Meta FAIR] https://arxiv.org/abs/2605.03546 ---[AI] What Happens Inside Agent Memory? Circuit Analysis from Emergence to Diagnosis [City University of Hong Kong & University of Toronto] https://arxiv.org/abs/2605.03354 ---[LG] Flow Sampling: Learning to Sample from Unnormalized Densities via Denoising Conditional Processes [FAIR at Meta & Weizmann Institute of Science] https://arxiv.org/abs/2605.03984 ---[AI] Self-Improvement for Fast, High-Quality Plan Generation [Amazon] https://arxiv.org/abs/2605.03625 在小宇宙查看该单集文稿

26分钟

99+

1个月前

[人人能懂AI前沿] 从并行智慧、元认知到瓶颈法则：洞悉AI的学习奥秘

AI可可AI生活

你有没有想过，为什么AI能从互联网的海量垃圾中炼出真金，而不是变成一个只会死记硬背的书呆子？当AI犯错时，我们是该让它闭嘴，还是有更聪明的办法让它学会“谦逊”？本期节目，我们将通过几篇最新的AI论文，揭示AI如何像一个并行专家团队一样解决难题，又是如何受困于一个惊人简洁的“瓶颈定律”，带你一窥AI大脑中那些优雅而深刻的学习法则。 00:00:33 最优解的密码，藏在并行的智慧里 00:05:55 AI怎么才能不说谎？答案藏在一种人类智慧里 00:10:13 AI训练场上的“隐形杀手” 00:16:52 AI怎么从一堆垃圾里炼出真金？ 00:23:33 增长的瓶颈定律，规模不是优势，弱点才是关键本期介绍的几篇论文： [LG] Black-box optimization of noisy functions with unknown smoothness [INRIA Lille & Google DeepMind] https://arxiv.org/abs/2605.02462 --- [CL] Hallucinations Undermine Trust; Metacognition is a Way Forward [Google Research & Tel Aviv University] https://arxiv.org/abs/2605.01428 --- [LG] Generalized Distributional Alignment Games for Unbiased Answer-Level Fine-Tuning [Google Research] https://arxiv.org/abs/2605.02435 --- [LG] A Theory of Generalization in Deep Learning [Stanford University] https://arxiv.org/abs/2605.01172 --- [LG] A Theory of Saddle Escape in Deep Nonlinear Networks [UC Berkeley] https://arxiv.org/abs/2605.01288

30分钟

99+

1个月前

[人人能懂AI前沿] AI学会了抄近路、换引擎和吃“后悔药”

AI可可AI生活

你有没有想过，AI也能不走寻常路，学会“抄近路”写文章吗？或者，当AI陷入追求高分的“内卷陷阱”时，我们该怎么教它“最小化遗憾”而不是盲目刷分？本期节目，我们将从几篇最新的论文出发，看看AI如何通过更换“发动机”、打通不同门派的“武功”，甚至用更少的考题更精准地对齐我们的真实感受，实现一次漂亮的思维跃迁。 00:00:30 抄近路，人工智能学会了新“导航术” 00:05:34 AI的“注意力”，正在成为它的“负担” 00:10:42 AI的“高分陷阱”，我们怎样教得更聪明？ 00:16:51 当规则遇上“混沌”，AI大神们的两种武功，原来同宗同源 00:23:38 为什么最好的考卷，题目反而最少？本期介绍的几篇论文： [LG] Consistent Diffusion Language Models [Microsoft & Purdue University] https://arxiv.org/abs/2605.00161 --- [LG] Caracal: Causal Architecture via Spectral Mixing [Huawei Technologies] https://arxiv.org/abs/2605.00292 --- [LG] Wasserstein Distributionally Robust Regret Optimization for Reinforcement Learning from Human Feedback [University of North Carolina & Imperial College London & Stanford University] https://arxiv.org/abs/2605.00155 --- [LG] Trees to Flows and Back: Unifying Decision Trees and Diffusion Models [Technical University of Munich] https://arxiv.org/abs/2605.00414 --- [CL] Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment [University of Southern California & Stanford University] https://arxiv.org/abs/2605.00022

29分钟

99+

1个月前

[人人能懂AI前沿] AI的成长三部曲：金牌教练、乐高大师与风光摄影师

[人人能懂AI前沿] AI的雕塑家、守门员与博弈论

[人人能懂AI前沿] AI的内功、表演与成长法则

[人人能懂AI前沿] AI的学霸秘籍、省钱妙计与陪练手册

[人人能懂AI前沿] 从聪明花钱、英雄涌现到AI的“偏科”报告

[人人能懂AI前沿] 从追问、拆解到打腹稿：AI正在升级“思考”的操作系统

[人人能懂AI前沿] 给AI“减肥”、“立人设”和“夸到点子上”，需要几步？

[人人能懂AI前沿] 从记忆宫殿、技能进化到创作的本质

[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈

[人人能懂AI前沿] AI的学霸笔记、建筑师思维与自我进化

[人人能懂AI前沿] 从并行智慧、元认知到瓶颈法则：洞悉AI的学习奥秘

[人人能懂AI前沿] AI学会了抄近路、换引擎和吃“后悔药”

加入我们的 Discord

扫描微信二维码

播放列表

AI可可AI生活 - 节目列表

[人人能懂AI前沿] AI的成长三部曲：金牌教练、乐高大师与风光摄影师

[人人能懂AI前沿] AI的雕塑家、守门员与博弈论

[人人能懂AI前沿] AI的内功、表演与成长法则

[人人能懂AI前沿] AI的学霸秘籍、省钱妙计与陪练手册

[人人能懂AI前沿] 从聪明花钱、英雄涌现到AI的“偏科”报告

[人人能懂AI前沿] 从追问、拆解到打腹稿：AI正在升级“思考”的操作系统

[人人能懂AI前沿] 给AI“减肥”、“立人设”和“夸到点子上”，需要几步？

[人人能懂AI前沿] 从记忆宫殿、技能进化到创作的本质

[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈

[人人能懂AI前沿] AI的学霸笔记、建筑师思维与自我进化

[人人能懂AI前沿] 从并行智慧、元认知到瓶颈法则：洞悉AI的学习奥秘

[人人能懂AI前沿] AI学会了抄近路、换引擎和吃“后悔药”

加入我们的 Discord

扫描微信二维码

播放列表