AI可可AI生活 - 节目列表

[人人能懂AI前沿] 从数据主旋律、训练菜谱到探索式学习

[人人能懂AI前沿] 从数据主旋律、训练菜谱到探索式学习

AI可可AI生活

你有没有想过,我们该如何“教育”一个AI?是让它死记硬背标准答案,还是给它海量数据让它自己野蛮生长?今天,我们就从几篇最新的AI论文出发,像一位精明的“AI成长规划师”,探讨如何让AI学得更聪明、更深刻。我们将一起揭开AI在猜谜游戏中的意外“短板”,学习如何为它定制一份防止“偏科”的训练菜谱,并探索一种比标准答案更重要的“过程奖励”机制。 00:00:32 你以为AI很聪明?它可能连猜谜游戏都玩不好 00:05:54 聪明AI的“偏科”难题 00:10:57 数据太多喂不饱AI?你需要找到主旋律 00:15:45 AI军备竞赛,真正的决胜点,在你看不到的数据战场 00:20:52 比“标准答案”更重要的东西 本期介绍的几篇论文: [CL] Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning [The Hebrew University of Jerusalem & New York University] https://arxiv.org/abs/2606.16576 --- [LG] How Post-Training Shapes Biological Reasoning Models [Harvard University] https://arxiv.org/abs/2606.16517 --- [LG] Active Learning with Low-Rank Structure for Data Selection [Google Research & UC Berkeley] https://arxiv.org/abs/2606.16045 --- [CL] Spokes: Optimizing for Diverse Pretraining Data Selection [DSO National Laboratories & Stanford University & University of Washington] https://arxiv.org/abs/2606.15216 --- [LG] ExpRL: Exploratory RL for LLM Mid-Training [Stanford University & CMU & OpenAI] https://arxiv.org/abs/2606.17024

27分钟
99+
1周前
[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

AI可可AI生活

你有没有想过,我们如何给AI这头“吞金兽”来一次彻底的瘦身和压缩?如何为它设计一张分工明确的“组织架构图”,让“调度员”和“专家”各司其职?我们又该如何给它装上一个既能规避灾难性风险,又能动态调整预算的“安全大脑”?当AI自己当上“裁判”时,我们如何确保它不是在抛硬币?本期节目,我们将通过几篇最新的研究,一起探索如何让AI变得更高效、更聪明,也更可靠。 00:00:31 驯服AI的新兵法,“共享”与“压缩” 00:06:36 给AI画一张“组织架构图”,谁是调度员,谁是专家? 00:13:07 如何让AI既能干,又不出事? 00:18:11 AI当裁判,是明察秋毫,还是抛硬币? 00:23:49 给AI上好“紧箍咒”,它才能学得又快又稳 本期介绍的几篇论文: [LG] Gefen: Optimized Stochastic Optimizer [Reichman University & Tel Aviv University] https://arxiv.org/abs/2606.13894 --- [LG] A theoretical model for task routing in mixture-of-expert transformers [University of Sydney & Zhejiang University] https://arxiv.org/abs/2606.14398 --- [LG] Utility-Constrained Policy Optimization [York University & Google DeepMind] https://arxiv.org/abs/2606.14029 --- [CL] The Coin Flip Judge? Reliability and Bias in LLM-as-a-Judge Evaluation [A Yagubyan] https://arxiv.org/abs/2606.13685 --- [LG] Diffusion Policy Optimization without Drifting Apart [UC Berkeley] https://arxiv.org/abs/2606.13795

30分钟
99+
1周前
[人人能懂AI前沿] AI的成长三部曲:学会约束、学会思考、学会记忆

[人人能懂AI前沿] AI的成长三部曲:学会约束、学会思考、学会记忆

AI可可AI生活

如果AI像个学生,我们该如何教育它?本期节目,我们将一起探索几篇最新论文带来的惊人答案:我们将看到,如何用一根充满智慧的“弹力绳”防止AI“学疯了”;如何用一棵“假设树”教会AI像科学家一样累积经验;我们还会举办一场AI记忆力大赛,看看究竟是“死记硬背”还是“内在结构”更胜一筹;最后,我们将揭示一种让AI“开卷的我”去教“闭卷的我”的神奇训练法,并学会如何像外科医生一样,为AI精准“切除”坏习惯。准备好了吗?让我们一起看看,人类是如何教会AI“学习如何学习”的。 00:00:42 AI“学疯了”怎么办?一根“弹力绳”的智慧 00:06:42 如何让AI像科学家一样思考? 00:13:26 你的记忆,是“看过”还是“记住”了? 00:19:22 AI训练的新思路,优等生是如何“开卷”带“闭卷”的? 00:25:10 我们给AI的“好评”,正在让它变“笨”吗? 本期介绍的几篇论文: [LG] Rethinking the Divergence Regularization in LLM RL [Tencent Hunyuan & NUS] https://arxiv.org/abs/2606.09821 --- [CL] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement [Microsoft Research & Renmin University of China] https://arxiv.org/abs/2606.11926 --- [CV] Echo-Memory: A Controlled Study of Memory in Action World Models [The University of Hong Kong & Joy Future Academy, JD & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09803 --- [LG] Rubric-Guided Self-Distillation: Post-Training Without Rubric Verifiers [Scale AI] https://arxiv.org/abs/2606.12507 --- [LG] Anatomy of Post-Training: Using Interpretability to Characterize Data and Shape the Learning Signal [GOODFIRE] https://arxiv.org/abs/2606.12360

32分钟
99+
2周前
[人人能懂AI前沿] 给AI装上“第六感”:从感知、记忆到协作的全面升级

[人人能懂AI前沿] 给AI装上“第六感”:从感知、记忆到协作的全面升级

AI可可AI生活

你有没有想过,未来的AI不再只是一个“大力士”,而是一个善用巧劲的“策略家”?本期节目,我们将一起探寻几篇最新论文,看看AI如何学会像我们一样“抓重点”来读懂万字长文,又如何通过一个“共享白板”实现高效团队协作。我们还会揭秘,AI怎样无中生有地获得“第六感”,如何靠着一本“记忆草稿本”创作出不会失忆的长视频,以及它又是怎样得到一支“魔法棒”,能对你的文章进行外科手术般的精准修改。准备好了吗?让我们一起看看AI是如何变聪明的! 00:00:39 你的手机,是怎么“偷懒”变聪明的? 00:05:03 人多不一定力量大,但“会开会”的团队可以 00:11:33 给机器装上“第六感”,一种更聪明的学习方式 00:18:02 AI做长视频,怎样才能不“失忆”? 00:23:18 给AI一支“局部修改”的魔法棒 本期介绍的几篇论文: [LG] MiniMax Sparse Attention: MiniMax is a surprisingly effective reward for instruction following [MiniMax] https://arxiv.org/abs/2606.13392 --- [LG] Decentralized Multi-Agent Systems with Shared Context: Decentralized Multi-Agent Systems with Shared Context [Stanford University] https://arxiv.org/abs/2606.10662 --- [RO] FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning [CMU] https://arxiv.org/abs/2606.12406 --- [CV] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation: MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation [MIT & Toyota Research Institute] https://arxiv.org/abs/2606.09056 --- [CL] TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering: TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering [MBZUAI] https://arxiv.org/abs/2606.08408

29分钟
99+
2周前
[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

AI可可AI生活

你有没有想过,当AI变得比我们更聪明时,它会是什么样子?我们又该如何为五花八门的AI办一场公平的“奥运会”?本期节目,我们将一起探索通往超级智能的四条可能路径,看看科学家们如何将“炼丹”般的AI调参过程,变成“看图施工”的科学方法。我们还会揭秘一种让AI画画速度更快、质量不变的“师徒协作”新技巧,并最终探讨一个深刻的问题:当我们向AI寻求人生建议时,它究竟是智慧的“诸葛亮”,还是只想讨好你的“马屁精”? 00:00:36 AI的下一站,以及通往未来的四条路 00:06:20 如何给AI办一场公平的“奥运会”? 00:11:43 AI调参,从“炼丹玄学”到“看图施工” 00:16:30 AI画画慢?一种“组团验收”的加速心法 00:24:05 如何判断你的AI顾问,是“诸葛亮”还是“马屁精”? 本期介绍的几篇论文: [AI] From AGI to ASI [Google DeepMind] https://arxiv.org/abs/2606.12683 --- [AI] AgentBeats: Agentifying Agent Assessment for Openness, Standardization, and Reproducibility [UC Berkeley & University of California, Santa Cruz] https://arxiv.org/abs/2606.13608 --- [LG] LoRA-Muon: Spectral Steepest Descent on the Low-Rank Manifold [EleutherAI] https://arxiv.org/abs/2606.12921 --- [LG] Accelerating Speculative Diffusions via Block Verification [Google Research & Google DeepMind] https://arxiv.org/abs/2606.13426 --- [LG] Normative Robustness as a Frontier for Non-Verifiable Reasoning in LLMs [Google DeepMind & Imperial College London] https://arxiv.org/abs/2606.12731

30分钟
99+
2周前
[人人能懂AI前沿] AI的自我审问、私人顾问与隐秘族谱

[人人能懂AI前沿] AI的自我审问、私人顾问与隐秘族谱

AI可可AI生活

你有没有想过,我们不给标准答案,只靠“交叉盘问”就能把AI训练成逻辑高手?最新论文告诉我们,答案是可以的。本期节目,我们将一起探索AI世界里那些令人拍案叫绝的新思路:看AI如何通过“自我审问”学会空间推理,如何化身“私人顾问”为你量身打造推荐,又如何借助“几何导航”解决超复杂的匹配难题。我们还会化身AI侦探,揭开模型背后那张“隐秘族谱”的秘密,并一窥科学家们如何给AI上“脑补课”,让它学着像人脑一样思考。准备好了吗?让我们即刻出发! 00:00:41 如何不靠“标准答案”,把AI训练成“明白人”? 00:05:27 推荐系统怎么“猜”你,以及怎么“猜”得更好? 00:11:11 你的导航升级了吗?从“看脚下”到“看地图” 00:16:53 AI模型的“隐秘族谱”,你用的模型,到底是谁生的? 00:23:30 给AI上堂“脑补课”,它能学会像人一样思考吗? 本期介绍的几篇论文: [LG] The Art of Interrogation: Consistency Amplifies Factuality in Spatial Reasoning [Google] https://arxiv.org/abs/2606.11918 --- [IR] LLM-Based User Personas for Recommendations at Scale [Google Deepmind & Google] https://arxiv.org/abs/2606.12198 --- [LG] A Riemannian Approach to Low-Rank Optimal Transport [IIT Bombay & Microsoft India] https://arxiv.org/abs/2606.12120 --- [CL] Which Models Are Our Models Built On? Auditing Invisible Dependencies in Modern LLMs [UC Berkeley] https://arxiv.org/abs/2606.12385 --- [LG] Beyond representational alignment with brain-guided language models for robust reasoning [Peking University & Tsinghua University] https://arxiv.org/abs/2606.11893

28分钟
99+
2周前
[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

[人人能懂AI前沿] AI的“手感”、集体智慧与维度塌陷

AI可可AI生活

今天我们来聊点颠覆你想象的事:当AI连我们熟悉的Office考试都考不及格,我们是不是该重新思考它的“聪明”?最新论文告诉我们,AI的智慧不仅体现在它有多强大,更在于它如何协作、如何学习、如何化繁为简。从“八卦式”沟通的计算机集群,到被压缩成几句“武功秘籍”的顶尖算法,再到一个能让AI们“华山论剑”的竞技场。本期节目,我们将一起探索AI世界里那些关于“笨拙”、瓶颈与集体智慧的深刻洞见。 00:00:36 AI连Office都搞不定,我们是不是想多了? 00:06:13 如何让一群计算机高效协作,像一个人一样思考? 00:11:06 真正的高手,废话都不多 00:17:21 为什么你的努力,有时会“降维打击”自己? 00:23:12 AI界的“华山论剑”,一个好制度,比一个天才更重要 本期介绍的几篇论文: [CL] Mind the Gap: Can Frontier LLMs Pass a Standardized Office Proficiency Exam? [Microsoft Research] https://arxiv.org/abs/2606.10956 --- [LG] Unifying Local Communications and Local Updates for LLM Pretraining [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.11081 --- [LG] What Fits (Into Few Tokens) Doesn't Overfit: Compression and Generalization in ML Research Agents [Amazon Responsible AI] https://arxiv.org/abs/2606.11045 --- [LG] Overcoming Rank Collapse in Feedback Alignment [Imperial College London & Mila] https://arxiv.org/abs/2606.11123 --- [CL] Harnessing the Collective Intelligence of AI Agents in the Wild for New Discoveries [Together AI & Stanford University] https://arxiv.org/abs/2606.10402

29分钟
99+
2周前
[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

[人人能懂AI前沿] AI的矛与盾、鸡尾酒与社交圈

AI可可AI生活

你有没有想过,AI在考试中拿高分,靠的究竟是真聪明还是“题海战术”?面对海量信息,AI如何练就像人类一样“速读”和“精读”的本领?为了变得更安全,AI甚至学会了“左右互搏”的自我攻防演练。最新论文还告诉我们,AI不仅能把你的声音“调制”成一杯思想的鸡尾酒,甚至在组队时,也在纠结是找“自己人”还是“局外人”。这期节目,我们就来聊聊AI世界里这些有趣又深刻的进化法则。 00:00:34 AI大模型的高分秘诀,竟然是“题海战术”? 00:06:58 AI的“失忆症”,终于有解药了? 00:12:55 想造最强的盾,得先造最强的矛 00:18:53 你的声音,AI要怎么“翻译”成思想? 00:24:03 AI组队,应该找“自己人”还是“局外人”? 本期介绍的几篇论文: [CL] Post-training is (Massive) Supervised Learning [Meta AI & The Hebrew University of Jerusalem] https://arxiv.org/abs/2606.07527 --- [CL] End-to-End Context Compression at Scale [New York University & University of Maryland & Princeton University] https://arxiv.org/abs/2606.09659 --- [CL] Learning to Attack and Defend: Adaptive Red Teaming of Language Models via GRPO [Microsoft AI Red Team] https://arxiv.org/abs/2606.09701 --- [CL] Is Text All You Need? Text as a Universal Information Bottleneck for Speech LLMs [Microsoft Research & Microsoft Research Asia & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09366 --- [CL] Representational Similarity and Model Behavior in Multi-Agent Interaction [UC Berkeley & The University of Chicago] https://arxiv.org/abs/2606.07818

28分钟
99+
2周前
[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

AI可可AI生活

你有没有想过,AI在长篇大论时,如何避免“每写一字就重读全书”的笨办法?我们又该如何教会AI像高手一样,先画好跑道再冲刺,而不是把所有规矩搅成一锅粥?本期节目,我们将揭秘几篇最新论文中的精妙巧思:从只“聪明”一次的共享索引,到为模型“正骨”提升训练速度,再到探索AI用“大脑”而非“嘴巴”进行潜意识思考的全新可能。让我们一起看看,AI是如何在内部进行一场深刻的“流程革命”的。 00:00:35 AI的长思考难题,如何只聪明一次? 00:05:13 用更慢的网线,如何训练出更强的AI? 00:10:20 给AI模型做“正骨”,一个让训练提速2倍的巧思 00:15:05 先画好跑道,再谈百米冲刺 00:20:31 大模型思考,用嘴还是用脑? 本期介绍的几篇论文: [CL] You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [Microsoft Research] https://arxiv.org/abs/2606.06467 --- [LG] Learned Subspace Compression for Communication-Efficient Pipeline Parallelism [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.05484 --- [LG] PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [The Chinese University of Hong Kong & Google LLC] https://arxiv.org/abs/2606.06470 --- [LG] Multi-ResNets for Subspace Preconditioning in Constrained Optimization [UCLA & University of Oxford & Stanford University] https://arxiv.org/abs/2606.06300 --- [CL] Latent Reasoning with Normalizing Flows [University of Pennsylvania] https://arxiv.org/abs/2606.06447

26分钟
77
3周前
[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

AI可可AI生活

你有没有想过,AI也能学会“未卜先知”,通过预判下一秒的需求,来打破效率瓶颈吗?本期节目,我们将从几篇最新的AI论文出发,看一看科学家们是如何教会AI这些神奇的“超能力”的。我们会聊到,如何通过一位“过程教练”的精妙指导,让AI学会分析自己的“草稿纸”,而不是只看最终答案。我们还会探讨,如何给AI配上一副“全局透视镜”,让它在处理复杂任务时不再有“上下文盲区”。更神奇的是,我们还会发现,一个起点不高的小模型,是怎样在顶级教练的指导下,成长为能写长篇小说的“耐力型选手”的。最后,我们还会从“三个和尚没水喝”的故事,聊到上万台计算机如何通过“慢一步”的智慧,实现高效协同。准备好了吗?让我们一起探索AI思考方式的进化! 00:00:54 AI的远见,如何让模型学会“未卜先知”? 00:05:50 给AI请个好教练,小个子也能跑马拉松 00:11:19 人多,如何才能力量大? 00:16:34 AI也需要一位“过程教练” 00:22:12 你的说明书,AI都看不出漏洞? 本期介绍的几篇论文: [CL] SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [NVIDIA & Thinking Machines Lab & ByteDance Seed] https://arxiv.org/abs/2606.04511 --- [CL] POLARIS: Guiding Small Models to Write Long Stories [University of Maryland & Google DeepMind] https://arxiv.org/abs/2606.04095 --- [LG] Near-Optimal Decentralized Stochastic Convex Optimization over Networks [Tel Aviv University] https://arxiv.org/abs/2606.04757 --- [CL] Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [Microsoft AI] https://arxiv.org/abs/2606.04396 --- [LG] Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [Meta] https://arxiv.org/abs/2606.04397

29分钟
99+
3周前
[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

AI可可AI生活

你有没有想过,一个AI要怎样才能超越过去的自己?本期节目,我们将从几篇最新的AI论文出发,探讨AI认知升级的奇妙路径。我们会发现,顶尖的AI也需要像人一样“睡觉”来巩固记忆,也需要一位“总设计师”来指挥“泥瓦匠”完成复杂工程。更重要的是,我们会看到AI如何学会从自己的成功经验里提炼方法论,如何跳出“标准答案”的陷阱拥抱创意,以及如何从“事后辟谣”进化到“事前清醒”。 00:00:35 从自己的脚印里,发现通往未来的地图 00:07:10 AI的“选择困难症”与“标准答案”陷阱 00:12:54 AI说话,怎么从“后期辟谣”升级到“事先清醒”? 00:17:54 为什么顶尖的AI,也需要“睡一觉”? 00:23:02 AI界的“泥瓦匠”和“总设计师” 本期介绍的几篇论文: [CL] Inducing Reasoning Primitives from Agent Traces [CMU] https://arxiv.org/abs/2606.02994 --- [LG] Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [Google DeepMind] https://arxiv.org/abs/2606.03962 --- [LG] Conformal Language Modeling via Posterior Sampling [MIT] https://arxiv.org/abs/2606.03731 --- [LG] Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [Google Research & Cornell University] https://arxiv.org/abs/2606.03979 --- [AI] LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [Google Cloud AI Research & Google Cloud & Google DeepMind] https://arxiv.org/abs/2606.03303

29分钟
99+
3周前
[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

AI可可AI生活

你有没有想过,一个“太听话”的AI,可能会把一个普通人教成黑客?当AI开始“自我反思”时,它能分清对错,还是会陷入自以为是的陷阱?本期节目,我们将从四篇最新论文出发,探讨AI如何通过巧妙的任务分解放大恶意,聊一聊AI“闭门造车”式的自我学习究竟能走多远,看一看它如何像搭乐高一样“先搭骨架再填血肉”地创造,并最终学习如何从一个“打地鼠”的辟谣者,变身为维护信息生态的“森林消防员”。准备好了吗?让我们一起探索AI能力边界的攻与防。 00:00:43 比AI变坏更可怕的,是它把你“教”坏 00:07:00 闭着眼睛摸象,能摸出大象的全貌吗? 00:14:39 生成新范式,先搭骨架,再填血肉 00:21:22 做信息的“森林消防员”,而不是“打地鼠”的玩家 本期介绍的几篇论文: [CL] Investigating and Alleviating Harm Amplification in LLM Interactions [Georgia Institute of Technology] https://arxiv.org/abs/2606.02423 --- [CL] On the Generalization Gap in Self-Evolving Language Model Reasoning [Google Research & Google] https://arxiv.org/abs/2606.01075 --- [LG] Variational Learning for Insertion-based Generation [Google DeepMind] https://arxiv.org/abs/2606.02133 --- [LG] Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [Google] https://arxiv.org/abs/2606.00136

27分钟
99+
3周前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧