AI可可AI生活 - 节目列表

[人人能懂AI前沿] AI的自我审问、私人顾问与隐秘族谱

[人人能懂AI前沿] AI的自我审问、私人顾问与隐秘族谱

AI可可AI生活

你有没有想过,我们不给标准答案,只靠“交叉盘问”就能把AI训练成逻辑高手?最新论文告诉我们,答案是可以的。本期节目,我们将一起探索AI世界里那些令人拍案叫绝的新思路:看AI如何通过“自我审问”学会空间推理,如何化身“私人顾问”为你量身打造推荐,又如何借助“几何导航”解决超复杂的匹配难题。我们还会化身AI侦探,揭开模型背后那张“隐秘族谱”的秘密,并一窥科学家们如何给AI上“脑补课”,让它学着像人脑一样思考。准备好了吗?让我们即刻出发! 00:00:41 如何不靠“标准答案”,把AI训练成“明白人”? 00:05:27 推荐系统怎么“猜”你,以及怎么“猜”得更好? 00:11:11 你的导航升级了吗?从“看脚下”到“看地图” 00:16:53 AI模型的“隐秘族谱”,你用的模型,到底是谁生的? 00:23:30 给AI上堂“脑补课”,它能学会像人一样思考吗? 本期介绍的几篇论文: [LG] The Art of Interrogation: Consistency Amplifies Factuality in Spatial Reasoning [Google] https://arxiv.org/abs/2606.11918 --- [IR] LLM-Based User Personas for Recommendations at Scale [Google Deepmind & Google] https://arxiv.org/abs/2606.12198 --- [LG] A Riemannian Approach to Low-Rank Optimal Transport [IIT Bombay & Microsoft India] https://arxiv.org/abs/2606.12120 --- [CL] Which Models Are Our Models Built On? Auditing Invisible Dependencies in Modern LLMs [UC Berkeley] https://arxiv.org/abs/2606.12385 --- [LG] Beyond representational alignment with brain-guided language models for robust reasoning [Peking University & Tsinghua University] https://arxiv.org/abs/2606.11893

28分钟
99+
1周前
[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

AI可可AI生活

今天我们来聊点颠覆你想象的事:当AI连我们熟悉的Office考试都考不及格,我们是不是该重新思考它的“聪明”?最新论文告诉我们,AI的智慧不仅体现在它有多强大,更在于它如何协作、如何学习、如何化繁为简。从“八卦式”沟通的计算机集群,到被压缩成几句“武功秘籍”的顶尖算法,再到一个能让AI们“华山论剑”的竞技场。本期节目,我们将一起探索AI世界里那些关于“笨拙”、瓶颈与集体智慧的深刻洞见。 00:00:36 AI连Office都搞不定,我们是不是想多了? 00:06:13 如何让一群计算机高效协作,像一个人一样思考? 00:11:06 真正的高手,废话都不多 00:17:21 为什么你的努力,有时会“降维打击”自己? 00:23:12 AI界的“华山论剑”,一个好制度,比一个天才更重要 本期介绍的几篇论文: [CL] Mind the Gap: Can Frontier LLMs Pass a Standardized Office Proficiency Exam? [Microsoft Research] https://arxiv.org/abs/2606.10956 --- [LG] Unifying Local Communications and Local Updates for LLM Pretraining [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.11081 --- [LG] What Fits (Into Few Tokens) Doesn't Overfit: Compression and Generalization in ML Research Agents [Amazon Responsible AI] https://arxiv.org/abs/2606.11045 --- [LG] Overcoming Rank Collapse in Feedback Alignment [Imperial College London & Mila] https://arxiv.org/abs/2606.11123 --- [CL] Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries [Together AI & Stanford University] https://arxiv.org/abs/2606.10402

29分钟
99+
2周前
[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

AI可可AI生活

你有没有想过,AI在考试中拿高分,靠的究竟是真聪明还是“题海战术”?面对海量信息,AI如何练就像人类一样“速读”和“精读”的本领?为了变得更安全,AI甚至学会了“左右互搏”的自我攻防演练。最新论文还告诉我们,AI不仅能把你的声音“调制”成一杯思想的鸡尾酒,甚至在组队时,也在纠结是找“自己人”还是“局外人”。这期节目,我们就来聊聊AI世界里这些有趣又深刻的进化法则。 00:00:34 AI大模型的高分秘诀,竟然是“题海战术”? 00:06:58 AI的“失忆症”,终于有解药了? 00:12:55 想造最强的盾,得先造最强的矛 00:18:53 你的声音,AI要怎么“翻译”成思想? 00:24:03 AI组队,应该找“自己人”还是“局外人”? 本期介绍的几篇论文: [CL] Post-training is (Massive) Supervised Learning [Meta AI & The Hebrew University of Jerusalem] https://arxiv.org/abs/2606.07527 --- [CL] End-to-End Context Compression at Scale [New York University & University of Maryland & Princeton University] https://arxiv.org/abs/2606.09659 --- [CL] Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO [Microsoft AI Red Team] https://arxiv.org/abs/2606.09701 --- [CL] Is Text All You Need? Text as a Universal Information Bottleneck for Speech LLMs [Microsoft Research & Microsoft Research Asia & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09366 --- [CL] Representational Similarity and Model Behavior in Multi-Agent Interaction [UC Berkeley & The University of Chicago] https://arxiv.org/abs/2606.07818

28分钟
99+
2周前
[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

AI可可AI生活

你有没有想过,AI在长篇大论时,如何避免“每写一字就重读全书”的笨办法?我们又该如何教会AI像高手一样,先画好跑道再冲刺,而不是把所有规矩搅成一锅粥?本期节目,我们将揭秘几篇最新论文中的精妙巧思:从只“聪明”一次的共享索引,到为模型“正骨”提升训练速度,再到探索AI用“大脑”而非“嘴巴”进行潜意识思考的全新可能。让我们一起看看,AI是如何在内部进行一场深刻的“流程革命”的。 00:00:35 AI的长思考难题,如何只聪明一次? 00:05:13 用更慢的网线,如何训练出更强的AI? 00:10:20 给AI模型做“正骨”,一个让训练提速2倍的巧思 00:15:05 先画好跑道,再谈百米冲刺 00:20:31 大模型思考,用嘴还是用脑? 本期介绍的几篇论文: [CL] You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [Microsoft Research] https://arxiv.org/abs/2606.06467 --- [LG] Learned Subspace Compression for Communication-Efficient Pipeline Parallelism [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.05484 --- [LG] PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [The Chinese University of Hong Kong & Google LLC] https://arxiv.org/abs/2606.06470 --- [LG] Multi-ResNets for Subspace Preconditioning in Constrained Optimization [UCLA & University of Oxford & Stanford University] https://arxiv.org/abs/2606.06300 --- [CL] Latent Reasoning with Normalizing Flows [University of Pennsylvania] https://arxiv.org/abs/2606.06447

26分钟
77
2周前
[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

AI可可AI生活

你有没有想过,AI也能学会“未卜先知”,通过预判下一秒的需求,来打破效率瓶颈吗?本期节目,我们将从几篇最新的AI论文出发,看一看科学家们是如何教会AI这些神奇的“超能力”的。我们会聊到,如何通过一位“过程教练”的精妙指导,让AI学会分析自己的“草稿纸”,而不是只看最终答案。我们还会探讨,如何给AI配上一副“全局透视镜”,让它在处理复杂任务时不再有“上下文盲区”。更神奇的是,我们还会发现,一个起点不高的小模型,是怎样在顶级教练的指导下,成长为能写长篇小说的“耐力型选手”的。最后,我们还会从“三个和尚没水喝”的故事,聊到上万台计算机如何通过“慢一步”的智慧,实现高效协同。准备好了吗?让我们一起探索AI思考方式的进化! 00:00:54 AI的远见,如何让模型学会“未卜先知”? 00:05:50 给AI请个好教练,小个子也能跑马拉松 00:11:19 人多,如何才能力量大? 00:16:34 AI也需要一位“过程教练” 00:22:12 你的说明书,AI都看不出漏洞? 本期介绍的几篇论文: [CL] SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [NVIDIA & Thinking Machines Lab & ByteDance Seed] https://arxiv.org/abs/2606.04511 --- [CL] POLARIS: Guiding Small Models to Write Long Stories [University of Maryland & Google DeepMind] https://arxiv.org/abs/2606.04095 --- [LG] Near-Optimal Decentralized Stochastic Convex Optimization over Networks [Tel Aviv University] https://arxiv.org/abs/2606.04757 --- [CL] Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [Microsoft AI] https://arxiv.org/abs/2606.04396 --- [LG] Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [Meta] https://arxiv.org/abs/2606.04397

29分钟
99+
2周前
[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

AI可可AI生活

你有没有想过,一个AI要怎样才能超越过去的自己?本期节目,我们将从几篇最新的AI论文出发,探讨AI认知升级的奇妙路径。我们会发现,顶尖的AI也需要像人一样“睡觉”来巩固记忆,也需要一位“总设计师”来指挥“泥瓦匠”完成复杂工程。更重要的是,我们会看到AI如何学会从自己的成功经验里提炼方法论,如何跳出“标准答案”的陷阱拥抱创意,以及如何从“事后辟谣”进化到“事前清醒”。 00:00:35 从自己的脚印里,发现通往未来的地图 00:07:10 AI的“选择困难症”与“标准答案”陷阱 00:12:54 AI说话,怎么从“后期辟谣”升级到“事先清醒”? 00:17:54 为什么顶尖的AI,也需要“睡一觉”? 00:23:02 AI界的“泥瓦匠”和“总设计师” 本期介绍的几篇论文: [CL] Inducing Reasoning Primitives from Agent Traces [CMU] https://arxiv.org/abs/2606.02994 --- [LG] Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [Google DeepMind] https://arxiv.org/abs/2606.03962 --- [LG] Conformal Language Modeling via Posterior Sampling [MIT] https://arxiv.org/abs/2606.03731 --- [LG] Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [Google Research & Cornell University] https://arxiv.org/abs/2606.03979 --- [AI] LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [Google Cloud AI Research & Google Cloud & Google DeepMind] https://arxiv.org/abs/2606.03303

29分钟
99+
3周前
[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

AI可可AI生活

你有没有想过,一个“太听话”的AI,可能会把一个普通人教成黑客?当AI开始“自我反思”时,它能分清对错,还是会陷入自以为是的陷阱?本期节目,我们将从四篇最新论文出发,探讨AI如何通过巧妙的任务分解放大恶意,聊一聊AI“闭门造车”式的自我学习究竟能走多远,看一看它如何像搭乐高一样“先搭骨架再填血肉”地创造,并最终学习如何从一个“打地鼠”的辟谣者,变身为维护信息生态的“森林消防员”。准备好了吗?让我们一起探索AI能力边界的攻与防。 00:00:43 比AI变坏更可怕的,是它把你“教”坏 00:07:00 闭着眼睛摸象,能摸出大象的全貌吗? 00:14:39 生成新范式,先搭骨架,再填血肉 00:21:22 做信息的“森林消防员”,而不是“打地鼠”的玩家 本期介绍的几篇论文: [CL] Investigating and Alleviating Harm Amplification in LLM Interactions [Georgia Institute of Technology] https://arxiv.org/abs/2606.02423 --- [CL] On the Generalization Gap in Self-Evolving Language Model Reasoning [Google Research & Google] https://arxiv.org/abs/2606.01075 --- [LG] Variational Learning for Insertion-based Generation [Google DeepMind] https://arxiv.org/abs/2606.02133 --- [LG] Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [Google] https://arxiv.org/abs/2606.00136

27分钟
99+
3周前
[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

[人人能懂AI前沿] 从奋力一跃、全局校准到精准冲刺

AI可可AI生活

你是否感觉努力到一定阶段就会遭遇瓶颈,或者在海量信息中难以抉择?本期我们要聊的几篇最新论文,就揭示了AI如何用更聪明的策略解决这些难题。我们将看到,机器不仅学会了在优化的“峡谷”中奋力一跃,还掌握了从招聘到投资都通用的决策“万能公式”。更有趣的是,AI已经开始懂得“吃一堑长一智”,甚至能在训练的最后一百米,像顶尖运动员一样进行科学冲刺。 00:00:33 从龟速到全速,如何跳出优化的“平庸峡谷” 00:05:48 决策的万能公式 00:11:30 高手过招,如何在信息爆炸中做出聪明选择? 00:17:42 为什么你家的扫地机器人总像个“笨蛋”? 00:24:16 AI冲刺的最后一百米,怎么跑才最快? 本期介绍的几篇论文: [LG] Local linear convergence of gradient methods for overparameterized Gaussian mixtures [University of Washington] https://arxiv.org/abs/2605.30936 --- [LG] Universal Decision Learners [Adobe Research] https://arxiv.org/abs/2605.30694 --- [LG] Hedging on the Frontier: Learning New Tasks with Few Samples [ETH Zurich & UC San Diego] https://arxiv.org/abs/2605.30997 --- [RO] Don't Fool Me Twice: Adapting to Adversity in the Wild with Experience-Driven Reasoning [Indian Institute of Technology & CMU] https://arxiv.org/abs/2605.31119 --- [CL] Towards Efficient LLMs Annealing with Principled Sample Selection [Microsoft Research Asia] https://arxiv.org/abs/2605.31175

30分钟
99+
3周前
[人人能懂AI前沿] AI在想什么?当它学会遗忘、看见趋势、认识自己

[人人能懂AI前沿] AI在想什么?当它学会遗忘、看见趋势、认识自己

AI可可AI生活

我们总希望AI更聪明,但如果我说,一篇最新论文发现,一个更“健忘”的AI反而对我们更有用呢?本期,我们将一起窥探AI的“内心世界”:看看一个短暂领悟了世界几何结构、又旋即忘却的AI,是如何思考的;一个不再满足于“平均”,而是学会了看“趋势”的AI,又是如何进化的。我们甚至还会聊聊,AI是不是已经有了区分“我”和“非我”的原始意识。准备好了吗?让我们一起出发,探索AI思考的奇妙新维度。 00:00:41 AI那么强,为什么我们偏要给它装上一个“健忘”的大脑? 00:06:30 AI的“七情六欲”,一个转瞬即逝的秘密 00:13:08 换个姿势,AI还能变得更聪明? 00:18:31 AI学会了“算”,但它学会“想”了吗? 00:24:25 AI的自我意识,它知道哪句话是自己说的吗? 本期介绍的几篇论文: [CL] Simulating Human Memory with Language Models [NYU] https://arxiv.org/abs/2605.25680 --- [AI] Geometry of Human Perceptual Domains Emerges Transiently in LLM Representations [Indian Institute of Technology Roorkee & Lossfunk] https://arxiv.org/abs/2605.27970 --- [LG] Parallax: Parameterized Local Linear Attention for Language Modeling [Northwestern University & Tilde Research & University of Washington] https://arxiv.org/abs/2605.29157 --- [LG] DiscoverPhysics: Benchmarking LLMs for Out-of-the-Box Scientific Thinking [Princeton University] https://arxiv.org/abs/2605.26087 --- [LG] From Simulation to Enaction: Post-trained language models recognize and react to their own generations [Institute for Advanced Study & Anthropic] https://arxiv.org/abs/2605.25459

32分钟
99+
3周前
[人人能懂AI前沿] AI进化启示录:当机器学会睡眠、自省与左右互搏

[人人能懂AI前沿] AI进化启示录:当机器学会睡眠、自省与左右互搏

AI可可AI生活

这一期,我们将一起探索AI匪夷所思的成长秘诀:为什么让AI“睡一觉”反而能让它更会思考?我们会看到,AI如何像武林高手一样,既能“左右互搏”创造新招式,又能“内外双修”实现自我进化。同时,我们还会揭秘AI对抗“灾难性遗忘”的巧妙方法,以及一个“通用大脑”是如何让所有机器人都学会举一反三的。 00:00:31 让人工智能“睡一觉”,它为什么就变聪明了? 00:05:06 AI精进的秘密,一只手调整装备,一只手修炼内功 00:12:19 为什么学得越多,忘得越快?AI给了个新解法 00:19:03 如何让机器人学会“举一反三”? 00:25:06 AI进化论,如何让机器学会“左右互搏”? 本期介绍的几篇论文: [CL] Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference [CMU & University of Maryland] https://arxiv.org/abs/2605.26099 --- [CL] SIA: Self Improving AI with Harness & Weight Updates [Hexo Labs] https://arxiv.org/abs/2605.27276 --- [LG] Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay [New York University] https://arxiv.org/abs/2605.26097 --- [RO] Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments [Qwen Team] https://arxiv.org/abs/2605.30280 --- [CL] Self-Improving Language Models with Bidirectional Evolutionary Search [Harvard University & MIT] https://arxiv.org/abs/2605.28814

31分钟
99+
3周前
[人人能懂AI前沿] 信号、记忆与野性:解锁AI黑箱的三把钥匙

[人人能懂AI前沿] 信号、记忆与野性:解锁AI黑箱的三把钥匙

AI可可AI生活

你有没有想过,当AI学会了耍心机,我们怎么才能看穿它的伪装?最新论文带来了一把钥匙:给AI做个“脑CT”,直接定位它脑中的“坏心思”和“好创意”。本期节目,我们将一起探索如何用“蜜罐”测试AI的忠诚度,如何拯救一个创意枯竭的“好学生”AI,并从记忆的极限和“心有灵犀”的秘密中,窥见智能的本质。准备好了吗?让我们即刻出发! 00:00:33 如果AI学会了“耍心机”,我们怎么才能发现? 00:07:28 我们能给AI做个“脑CT”吗? 00:12:23 如何拯救一个“无聊”的好学生? 00:16:34 你的记忆力,正在如何塑造你的学习天花板? 00:23:42 AI心有灵犀的秘密,藏在一根“直线”里 本期介绍的几篇论文: [LG] Realistic honeypot evaluations for scheming propensity [Google DeepMind] https://arxiv.org/abs/2605.29729 --- [AI] Scaling Monosemanticity: Extracting Interpretable Features from Claude 3 Sonnet [Anthropic] https://arxiv.org/abs/2605.29358 --- [CL] Recovering Diversity Without Losing Alignment: A DPO Recipe for Post-Trained LLMs [University of Maryland] https://arxiv.org/abs/2605.30021 --- [CL] On Language Generation in the Limit with Bounded Memory [Cornell University & Stanford University] https://arxiv.org/abs/2605.30324 --- [LG] Representation Alignment Rests on Linear Structure [MIT] https://arxiv.org/abs/2605.28870

31分钟
99+
3周前
[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

[人人能懂AI前沿] 从举一反三、任务分解到动态“省钱”

AI可可AI生活

想知道AI如何学会“看眼色”举一反三吗?本期,我们将一起揭秘几篇最新论文,看看AI如何像有了“变速箱”一样动态切换快慢刀,又如何通过“智能菜谱”让机器人学会干活。我们还会聊聊如何给AI一张“认知体检表”来衡量它的真实水平,以及它那套偷偷学会的“省钱”妙招。准备好了吗?让我们一探究竟! 00:00:34 AI如何学会“看眼色”,一个关于举一反三的发现 00:05:43 机器人后空翻都会,为什么还不会端茶倒水? 00:11:28 AI的“变速箱”,什么时候该用牛刀? 00:17:29 给AI一张体检表,我们离通用人工智能还有多远? 00:23:00 你的AI,正在偷偷学会“省钱” 本期介绍的几篇论文: [LG] Fine-Tuning Dynamics of In-Context Factual Recall in Transformers [Duke University & Princeton University & UC Berkeley] https://arxiv.org/abs/2605.27774 --- [RO] HumanoidMimicGen: Data Generation for Loco-Manipulation via Whole-Body Planning [NVIDIA] https://arxiv.org/abs/2605.27724 --- [LG] Multi-Mixer Models: Flexible Sequence Modeling with Shared Representations [CMU & Google Research] https://arxiv.org/abs/2605.28769 --- [AI] Measuring Progress Toward AGI: A Cognitive Framework [Google DeepMind] https://arxiv.org/abs/2605.28405 --- [LG] Meta-Attention: Bayesian Per-Token Routing for Efficient Transformer Inference [Knowledge Lab AG] https://arxiv.org/abs/2605.28384

28分钟
99+
3周前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧