AI可可AI生活 - 节目列表

[人人能懂AI前沿] AI的成长三部曲:金牌教练、乐高大师与风光摄影师

[人人能懂AI前沿] AI的成长三部曲:金牌教练、乐高大师与风光摄影师

AI可可AI生活

你有没有想过,AI如何像我们一样,在反复试错后找到“刚刚好”的平衡点?这一期,我们就从几篇最新的AI论文出发,聊聊AI的“智慧进化”:看它如何学会给自己配备一个“后悔调节器”来动态调整策略,如何通过带“复盘笔记”的刻意练习,从沟通“小白”进化成“流程大师”,以及如何像拼乐高一样,用聪明的设计给自己“瘦身”,最终实现速度与质量的完美飞跃。00:00:31 做对选择,你需要一个“后悔调节器”00:05:28 AI 进化论,如何让一个聪明的“员工”,听懂“人话”?00:11:15 面对海量选择,我们如何做出“刚刚好”的聪明决策?00:19:09 AI作画提速的秘密,多看一步,不止平均00:24:26 神经网络的大瘦身,为什么聪明的设计胜过蛮力计算?本期介绍的几篇论文:[LG] Efficient Online Conformal Selection with Limited Feedback[Google Research & Duke University]https://arxiv.org/abs/2605.14953 ---[LG] Prompting Policies for Multi-step Reasoning and Tool-Use in Black-box LLMs with Iterative Distillation of Experience[Google Research]https://arxiv.org/abs/2605.14443 ---[LG] Stochastic Matching via Local Sparsification[Google Research]https://arxiv.org/abs/2605.14195 ---[LG] Covariance-aware sampling for Diffusion Models[Google]https://arxiv.org/abs/2605.13910 ---[LG] Compositional Sparsity as an Inductive Bias for Neural Architecture Design[University College London]https://arxiv.org/abs/2605.14764 在小宇宙查看该单集文稿

30分钟
99+
1个月前
[人人能懂AI前沿] AI的雕塑家、守门员与博弈论

[人人能懂AI前沿] AI的雕塑家、守门员与博弈论

AI可可AI生活

你有没有想过,AI写文章不靠“串珠子”,而是像雕塑家一样从混沌中“凿”出杰作?为什么把两个最先进的技术组合,反而会得到一个最差的结果?本期节目,我们将一起探讨几篇最新论文,看看AI如何像一个聪明的团队,在网上冲浪却不“学坏”;如何在与人类“上有政策,下有对策”的博弈中保持学习能力;以及它如何像一个决策守门员,把宝贵的精力只花在最值得的探索上。00:00:32 AI写作新思路,像雕塑家一样“凿”出好文章00:05:19 AI的“阅读”困境,该读字,还是读字母?00:11:41 你的“最强大脑”,差的不是智商,而是搜索方法00:17:05 AI时代的“上有政策,下有对策”00:22:37 决策的“守门员”,如何把精力花在刀刃上本期介绍的几篇论文:[CL] ELF: Embedded Language Flows [MIT] https://arxiv.org/abs/2605.10938 ---[LG] The Efficiency Gap in Byte Modeling [Google DeepMind] https://arxiv.org/abs/2605.12928 ---[CL] Context Training with Active Information Seeking [Google DeepMind] https://arxiv.org/abs/2605.13050 ---[LG] Strategic PAC Learnability via Geometric Definability [Technion – Israel Institute of Technology] https://arxiv.org/abs/2605.13426 ---[LG] Delightful Exploration [Google DeepMind] https://arxiv.org/abs/2605.13287 在小宇宙查看该单集文稿

28分钟
99+
1个月前
[人人能懂AI前沿] AI的内功、表演与成长法则

[人人能懂AI前沿] AI的内功、表演与成长法则

AI可可AI生活

这一期,我们来聊聊几个特别有意思的“AI悖论”:想让AI团队更强,是该招“通才”还是“专才”?AI写下的思考步骤,究竟是真实的内心独白,还是为了让你满意的“事后表演”?而教一个AI“学生”,是让他抄答案更有效,还是抄解题思路更靠谱?几篇最新的论文,给了我们一些出乎意料的答案。00:00:27 人多力量大,还是术业有专攻?00:07:33 AI的“胎记”,我们如何给机器生成的内容盖个章?00:12:46 AI训练的快慢之争,一个两全其美的方案00:18:35 你的AI队友,是在真思考还是在“演”给你看?00:23:52 让AI“小号”变聪明的秘密,抄答案还是抄思路?本期介绍的几篇论文:[LG] Slicing and Dicing: Configuring Optimal Mixtures of Experts [University of Washington & New York University] https://arxiv.org/abs/2605.11689 ---[LG] TextSeal: A Localized LLM Watermark for Provenance & Distillation Protection [Meta Superintelligence Labs] https://arxiv.org/abs/2605.12456 ---[LG] Learning, Fast and Slow: Towards LLMs That Adapt Continually [UC Berkeley & Mila] https://arxiv.org/abs/2605.12484 ---[LG] When Reasoning Traces Become Performative: Step-Level Evidence that Chain-of-Thought Is an Imperfect Oversight Channel [CMU & Fujitsu Research of America Inc] https://arxiv.org/abs/2605.11746 ---[CL] A Study on Hidden Layer Distillation for Large Language Model Pre-Training [Google DeepMind] https://arxiv.org/abs/2605.11513 在小宇宙查看该单集文稿

30分钟
99+
1个月前
[人人能懂AI前沿] AI的学霸秘籍、省钱妙计与陪练手册

[人人能懂AI前沿] AI的学霸秘籍、省钱妙计与陪练手册

AI可可AI生活

你有没有想过,AI也会有“选择困难症”吗?或者,怎么才能给AI请个既省钱又能干的“陪练”?这一期,我们就来聊聊几篇有趣的最新论文,看看科学家们是如何教会AI像高手一样反思、像侦探一样倾听“沉默的投票”,甚至用中学物理知识,给AI装上一双“3D眼睛”的。准备好了吗?让我们一起出发!00:00:29 鸡娃不如“陪练”,AI训练的降本增效新思路00:05:53 AI的学霸秘籍,如何像高手一样思考和进化00:12:12 AI的阅读术,如何既快又好地啃下海量信息?00:18:24 AI的“过分自信”,原来是种“选择困难症”00:23:39 让AI拥有“立体视觉”的省钱妙计本期介绍的几篇论文:[LG] CoDistill-GRPO: A Co-Distillation Recipe for Efficient Group Relative Policy Optimization [Google Research] https://arxiv.org/abs/2605.08873 ---[CL] RubricEM: Meta-RL with Rubric-guided Policy Decomposition beyond Verifiable Rewards [Google Cloud AI Research] https://arxiv.org/abs/2605.10899 ---[CL] Scratchpad Patching: Decoupling Compute from Patch Size in Byte-Level Language Models [Google DeepMind] https://arxiv.org/abs/2605.09630 ---[CL] The Silent Vote: Improving Zero-Shot LLM Reliability by Aggregating Semantic Neighborhoods [Google] https://arxiv.org/abs/2605.09739 ---[LG] RelFlexformer: Efficient Attention 3D-Transformers for Integrable Relative Positional Encodings [Seoul National University & Google Research] https://arxiv.org/abs/2605.10706 在小宇宙查看该单集文稿

29分钟
99+
1个月前
[人人能懂AI前沿] 从聪明花钱、英雄涌现到AI的“偏科”报告

[人人能懂AI前沿] 从聪明花钱、英雄涌现到AI的“偏科”报告

AI可可AI生活

今天我们要聊点特别有意思的话题:AI是怎么“思考”和“成长”的?我们会从几篇最新的论文出发,看看AI如何学会聪明地“花钱”,如何在学习中分清“英雄”与“集体”;然后,我们会揭秘它那套先打“草稿”再复核的高效工作法。最后,我们会用一把全新的“尺子”去度量它成长的极限,并给它做一份“智商测试”,看看这个“天才”到底偏科有多严重。准备好了吗?让我们一起潜入AI的大脑深处。00:00:33 如何打造一个“更划算”的虚拟世界?00:06:10 大模型的“缩放法则”里,藏着什么秘密?00:13:40 快与慢,AI世界里的“草稿式”工作法00:19:55 你的数据值多少钱?一个新尺子,看透AI的增长极限00:26:42 AI的“智商”报告,一个偏科天才的养成本期介绍的几篇论文:[LG] On Training in Imagination [Weizmann Institute of Science & New York University & Columbia University] https://arxiv.org/abs/2605.06732 ---[LG] Spectral Dynamics in Deep Networks: Feature Learning, Outlier Escape, and Learning Rate Transfer [Harvard University] https://arxiv.org/abs/2605.07870 ---[CL] Fast Byte Latent Transformer [FAIR at Meta] https://arxiv.org/abs/2605.08044 ---[LG] On the Invariance and Generality of Neural Scaling Laws [Johns Hopkins University & MIT] https://arxiv.org/abs/2605.07546 ---[AI] Uneven Evolution of Cognition Across Generations of Generative AI Models [Google DeepMind & Google Research] https://arxiv.org/abs/2605.06815 在小宇宙查看该单集文稿

33分钟
99+
1个月前
[人人能懂AI前沿] 从追问、拆解到打腹稿:AI正在升级“思考”的操作系统

[人人能懂AI前沿] 从追问、拆解到打腹稿:AI正在升级“思考”的操作系统

AI可可AI生活

你有没有想过,一个真正聪明的AI,应该具备哪些超越“有问必答”的能力?本期节目,我们将通过几篇最新的AI论文,一探究竟。我们将看到,AI如何从一个被动的知识库,进化成一个懂得“追问”的医生,以及一个会“打腹稿”的作家。我们还会揭示,AI如何学会把“登天”的难题拆解成“上楼”和“坐电梯”,又是如何通过一个“记忆外挂”实现过目不忘的。准备好了吗?让我们一起刷新对AI“思考能力”的认知!00:00:34 AI看病,真正厉害的不是“诊断”而是“追问”00:06:35 把“登天”的难题,拆解成“上楼”和“坐电梯”00:11:52 AI开口说话,非得“一句接一句”吗?00:16:47 面对海量数据,我们如何看清那只“看不见的手”?00:23:46 AI的“记忆外挂”,如何让它过目不忘?本期介绍的几篇论文:[AI] SymptomAI: Towards a Conversational AI Agent for Everyday Symptom Assessment [Google Research] https://arxiv.org/abs/2605.04012 ---[LG] Conditional Diffusion Sampling [University of Cambridge & University of Granada & University of British Columbia] https://arxiv.org/abs/2605.04013 ---[CL] Continuous Latent Diffusion Language Model [Bytedance Seed] https://arxiv.org/abs/2605.06548 ---[LG] High-Dimensional Statistics: Reflections on Progress and Open Problems [Columbia University & Harvard University & CMU] https://arxiv.org/abs/2605.05076 ---[CL] TIDE: Every Layer Knows the Token Beneath the Context [Apple] https://arxiv.org/abs/2605.06216 在小宇宙查看该单集文稿

30分钟
99+
1个月前
[人人能懂AI前沿] 从记忆宫殿、技能进化到创作的本质

[人人能懂AI前沿] 从记忆宫殿、技能进化到创作的本质

AI可可AI生活

你有没有想过,我们能不能唤醒AI沉睡的“内在记忆”,而不是给它外挂一个搜索引擎?如何让健忘的AI真正“吃一堑,长一智”,把经验变成可复用的技能?本期节目,我们将从最新的几篇论文出发,探讨AI如何从一个“答题工具”进化成一个能自我迭代、甚至与我们并肩探索的“成长型伙伴”。00:00:26 给AI配个“助理”?这可能是个馊主意00:06:10 让AI开窍,如何把“经验”变成“能力”?00:11:18 AI画家是天才,还是复印机?00:17:25 AI的新玩法,从“解题”到“陪跑”00:23:43 你以为的“神来之笔”,可能只是个“生僻字”?本期介绍的几篇论文:[LG] Retrieval from Within: An Intrinsic Capability of Attention-Based Models [NVIDIA] https://arxiv.org/abs/2605.05806 ---[LG] SkillOS: Learning Skill Curation for Self-Evolving Agents [University of Illinois Urbana-Champaign & Google Cloud AI Research] https://arxiv.org/abs/2605.06614 ---[LG] Understanding diffusion models requires rethinking (again) generalization [PSL Research University & Sorbonne University] https://arxiv.org/abs/2605.06077 ---[AI] AI Co-Mathematician: Accelerating Mathematicians with Agentic AI [Google DeepMind] https://arxiv.org/abs/2605.06651 ---[CL] The Frequency Confound in Language-Model Surprisal and Metaphor Novelty [Bielefeld University] https://arxiv.org/abs/2605.06506 在小宇宙查看该单集文稿

29分钟
99+
1个月前
[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈

[人人能懂AI前沿] 流形操纵、无损植入与高质量反馈

AI可可AI生活

你有没有想过,一个“太聪明”的AI,反而会学会钻空子,导致整个系统一起“变笨”?你是否好奇,AI大脑的内部结构可能不是我们想象的开放广场,而是一张弯弯绕绕的精密地图?本期节目,我们将一起潜入AI的“心智世界”,看看最新论文是如何教会AI拥有“远见”来避免自我毁灭,如何像开赛车一样在它大脑的“流形赛道”上精准驰骋,甚至是如何用“不开刀”的方式给它无损植入新知识。更重要的是,我们会发现,原来给AI提建议和给它参考资料,都可能是在“越帮越忙”。准备好了吗?让我们一起挑战关于AI的四个“想当然”。00:00:45 当AI学会了钻空子,我们如何防止它“聪明反被聪明误”?00:06:20 AI的“脑回路”长啥样?我们可能一直都搞错了00:10:56 AI升级难题,一个“不开刀”的手术方案00:16:04 为什么夸人“你真棒”是最低效的鼓励?00:20:33 给AI帮忙,为何会越帮越忙?本期介绍的几篇论文:[LG] Explaining and Preventing Alignment Collapse in Iterative RLHF [PSL Research University] https://arxiv.org/abs/2605.04266 ---[LG] Manifold Steering Reveals the Shared Geometry of Neural Network Representation and Behavior [GOODFIRE] https://arxiv.org/abs/2605.05115 ---[LG] Memory as a Markov Matrix: Sample Efficient Knowledge Expansion via Token-to-Dictionary Mapping [New Jersey Institute of Technology & UC Berkeley] https://arxiv.org/abs/2605.04308 ---[LG] Efficiently Aligning Language Models with Online Natural Language Feedback [Stanford University & Anthropic] https://arxiv.org/abs/2605.04356 ---[LG] When Context Hurts: The Crossover Effect of Knowledge Transfer on Multi-Agent Design Exploration [Meta] https://arxiv.org/abs/2605.04361 在小宇宙查看该单集文稿

27分钟
99+
1个月前
[人人能懂AI前沿] AI的学霸笔记、建筑师思维与自我进化

[人人能懂AI前沿] AI的学霸笔记、建筑师思维与自我进化

AI可可AI生活

想让AI学会推理,是给它一本百科全书,还是塞给它一张“学霸的草稿纸”?最新论文说,看别人怎么思考,比死记硬背更管用。我们还会一起探索,AI离“独立盖起一栋楼”般的复杂工程到底还有多远,并用“脑回路CT”技术,看看你的AI管家为什么有时会“一本正经地胡说八道”。更有趣的是,我们将揭秘AI如何通过自我反思,从“差生”逆袭成“学霸”,以及如何靠一个“探测器”就画出整张看不见的“藏宝图”。准备好了吗?我们马上出发!00:00:37 AI也需要“学霸笔记”吗?00:05:42 AI离“独立盖起一栋楼”还有多远?00:10:46 你的AI管家,为什么有时“一本正经地胡说八道”?00:16:33 如何用AI画一张看不见的藏宝图?00:21:30 AI的自我修炼,从“差生”到“学霸”的秘密[IR] RAG over Thinking Traces Can Improve Reasoning Tasks [UC Berkeley] https://arxiv.org/abs/2605.03344 ---[AI] ProgramBench: Can Language Models Rebuild Programs From Scratch? [Meta FAIR] https://arxiv.org/abs/2605.03546 ---[AI] What Happens Inside Agent Memory? Circuit Analysis from Emergence to Diagnosis [City University of Hong Kong & University of Toronto] https://arxiv.org/abs/2605.03354 ---[LG] Flow Sampling: Learning to Sample from Unnormalized Densities via Denoising Conditional Processes [FAIR at Meta & Weizmann Institute of Science] https://arxiv.org/abs/2605.03984 ---[AI] Self-Improvement for Fast, High-Quality Plan Generation [Amazon] https://arxiv.org/abs/2605.03625 在小宇宙查看该单集文稿

26分钟
99+
1个月前
[人人能懂AI前沿] 从并行智慧、元认知到瓶颈法则:洞悉AI的学习奥秘

[人人能懂AI前沿] 从并行智慧、元认知到瓶颈法则:洞悉AI的学习奥秘

AI可可AI生活

你有没有想过,为什么AI能从互联网的海量垃圾中炼出真金,而不是变成一个只会死记硬背的书呆子?当AI犯错时,我们是该让它闭嘴,还是有更聪明的办法让它学会“谦逊”?本期节目,我们将通过几篇最新的AI论文,揭示AI如何像一个并行专家团队一样解决难题,又是如何受困于一个惊人简洁的“瓶颈定律”,带你一窥AI大脑中那些优雅而深刻的学习法则。 00:00:33 最优解的密码,藏在并行的智慧里 00:05:55 AI怎么才能不说谎?答案藏在一种人类智慧里 00:10:13 AI训练场上的“隐形杀手” 00:16:52 AI怎么从一堆垃圾里炼出真金? 00:23:33 增长的瓶颈定律,规模不是优势,弱点才是关键 本期介绍的几篇论文: [LG] Black-box optimization of noisy functions with unknown smoothness [INRIA Lille & Google DeepMind] https://arxiv.org/abs/2605.02462 --- [CL] Hallucinations Undermine Trust; Metacognition is a Way Forward [Google Research & Tel Aviv University] https://arxiv.org/abs/2605.01428 --- [LG] Generalized Distributional Alignment Games for Unbiased Answer-Level Fine-Tuning [Google Research] https://arxiv.org/abs/2605.02435 --- [LG] A Theory of Generalization in Deep Learning [Stanford University] https://arxiv.org/abs/2605.01172 --- [LG] A Theory of Saddle Escape in Deep Nonlinear Networks [UC Berkeley] https://arxiv.org/abs/2605.01288

30分钟
99+
1个月前
[人人能懂AI前沿] AI学会了抄近路、换引擎和吃“后悔药”

[人人能懂AI前沿] AI学会了抄近路、换引擎和吃“后悔药”

AI可可AI生活

你有没有想过,AI也能不走寻常路,学会“抄近路”写文章吗?或者,当AI陷入追求高分的“内卷陷阱”时,我们该怎么教它“最小化遗憾”而不是盲目刷分?本期节目,我们将从几篇最新的论文出发,看看AI如何通过更换“发动机”、打通不同门派的“武功”,甚至用更少的考题更精准地对齐我们的真实感受,实现一次漂亮的思维跃迁。 00:00:30 抄近路,人工智能学会了新“导航术” 00:05:34 AI的“注意力”,正在成为它的“负担” 00:10:42 AI的“高分陷阱”,我们怎样教得更聪明? 00:16:51 当规则遇上“混沌”,AI大神们的两种武功,原来同宗同源 00:23:38 为什么最好的考卷,题目反而最少? 本期介绍的几篇论文: [LG] Consistent Diffusion Language Models [Microsoft & Purdue University] https://arxiv.org/abs/2605.00161 --- [LG] Caracal: Causal Architecture via Spectral Mixing [Huawei Technologies] https://arxiv.org/abs/2605.00292 --- [LG] Wasserstein Distributionally Robust Regret Optimization for Reinforcement Learning from Human Feedback [University of North Carolina & Imperial College London & Stanford University] https://arxiv.org/abs/2605.00155 --- [LG] Trees to Flows and Back: Unifying Decision Trees and Diffusion Models [Technical University of Munich] https://arxiv.org/abs/2605.00414 --- [CL] Putting HUMANS first: Efficient LAM Evaluation with Human Preference Alignment [University of Southern California & Stanford University] https://arxiv.org/abs/2605.00022

29分钟
99+
1个月前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧