Album

AI可可AI生活

用最通俗的语言,跟进最前沿的人工智能科研成果

fly51fly fly51fly
1.72万 订阅 955 集 2周前
播客简介
来自 @爱可可-爱生活 的第一手AI快报,用最简单易懂的语言,带你直击最前沿的人工智能科研动态。无论你是科技小白,还是行业达人,这里都有你想知道的AI故事和未来趋势。跟着我们,轻松解锁人工智能的无限可能! #人工智能 #科技前沿
节目
[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

[人人能懂AI前沿] 从共享索引到潜意识思考:AI如何变得更“聪明”?

AI可可AI生活

你有没有想过,AI在长篇大论时,如何避免“每写一字就重读全书”的笨办法?我们又该如何教会AI像高手一样,先画好跑道再冲刺,而不是把所有规矩搅成一锅粥?本期节目,我们将揭秘几篇最新论文中的精妙巧思:从只“聪明”一次的共享索引,到为模型“正骨”提升训练速度,再到探索AI用“大脑”而非“嘴巴”进行潜意识思考的全新可能。让我们一起看看,AI是如何在内部进行一场深刻的“流程革命”的。 00:00:35 AI的长思考难题,如何只聪明一次? 00:05:13 用更慢的网线,如何训练出更强的AI? 00:10:20 给AI模型做“正骨”,一个让训练提速2倍的巧思 00:15:05 先画好跑道,再谈百米冲刺 00:20:31 大模型思考,用嘴还是用脑? 本期介绍的几篇论文: [CL] You Only Index Once: Cross-Layer Sparse Attention with Shared Routing [Microsoft Research] https://arxiv.org/abs/2606.06467 --- [LG] Learned Subspace Compression for Communication-Efficient Pipeline Parallelism [Concordia University & Sorbonne University] https://arxiv.org/abs/2606.05484 --- [LG] PC Layer: Polynomial Weight Preconditioning for Improving LLM Pre-Training [The Chinese University of Hong Kong & Google LLC] https://arxiv.org/abs/2606.06470 --- [LG] Multi-ResNets for Subspace Preconditioning in Constrained Optimization [UCLA & University of Oxford & Stanford University] https://arxiv.org/abs/2606.06300 --- [CL] Latent Reasoning with Normalizing Flows [University of Pennsylvania] https://arxiv.org/abs/2606.06447

26分钟
77
2周前
[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

[人人能懂AI前沿] 从时间魔术、过程教练到全局透视镜

AI可可AI生活

你有没有想过,AI也能学会“未卜先知”,通过预判下一秒的需求,来打破效率瓶颈吗?本期节目,我们将从几篇最新的AI论文出发,看一看科学家们是如何教会AI这些神奇的“超能力”的。我们会聊到,如何通过一位“过程教练”的精妙指导,让AI学会分析自己的“草稿纸”,而不是只看最终答案。我们还会探讨,如何给AI配上一副“全局透视镜”,让它在处理复杂任务时不再有“上下文盲区”。更神奇的是,我们还会发现,一个起点不高的小模型,是怎样在顶级教练的指导下,成长为能写长篇小说的“耐力型选手”的。最后,我们还会从“三个和尚没水喝”的故事,聊到上万台计算机如何通过“慢一步”的智慧,实现高效协同。准备好了吗?让我们一起探索AI思考方式的进化! 00:00:54 AI的远见,如何让模型学会“未卜先知”? 00:05:50 给AI请个好教练,小个子也能跑马拉松 00:11:19 人多,如何才能力量大? 00:16:34 AI也需要一位“过程教练” 00:22:12 你的说明书,AI都看不出漏洞? 本期介绍的几篇论文: [CL] SparDA: Sparse Decoupled Attention for Efficient Long-Context LLM Inference [NVIDIA & Thinking Machines Lab & ByteDance Seed] https://arxiv.org/abs/2606.04511 --- [CL] POLARIS: Guiding Small Models to Write Long Stories [University of Maryland & Google DeepMind] https://arxiv.org/abs/2606.04095 --- [LG] Near-Optimal Decentralized Stochastic Convex Optimization over Networks [Tel Aviv University] https://arxiv.org/abs/2606.04757 --- [CL] Read the Trace, Steer the Path: Trajectory-Aware Reinforcement Learning for Diffusion Language Models [Microsoft AI] https://arxiv.org/abs/2606.04396 --- [LG] Context-as-a-Service: Surfacing Cross-File Dependency Chains for LLM-Generated Developer Documentation [Meta] https://arxiv.org/abs/2606.04397

29分钟
99+
2周前
[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

[人人能懂AI前沿] 自我复盘、拥抱不确定与事前清醒

AI可可AI生活

你有没有想过,一个AI要怎样才能超越过去的自己?本期节目,我们将从几篇最新的AI论文出发,探讨AI认知升级的奇妙路径。我们会发现,顶尖的AI也需要像人一样“睡觉”来巩固记忆,也需要一位“总设计师”来指挥“泥瓦匠”完成复杂工程。更重要的是,我们会看到AI如何学会从自己的成功经验里提炼方法论,如何跳出“标准答案”的陷阱拥抱创意,以及如何从“事后辟谣”进化到“事前清醒”。 00:00:35 从自己的脚印里,发现通往未来的地图 00:07:10 AI的“选择困难症”与“标准答案”陷阱 00:12:54 AI说话,怎么从“后期辟谣”升级到“事先清醒”? 00:17:54 为什么顶尖的AI,也需要“睡一觉”? 00:23:02 AI界的“泥瓦匠”和“总设计师” 本期介绍的几篇论文: [CL] Inducing Reasoning Primitives from Agent Traces [CMU] https://arxiv.org/abs/2606.02994 --- [LG] Using Reward Uncertainty to Induce Diverse Behaviour in Reinforcement Learning [Google DeepMind] https://arxiv.org/abs/2606.03962 --- [LG] Conformal Language Modeling via Posterior Sampling [MIT] https://arxiv.org/abs/2606.03731 --- [LG] Language Models Need Sleep: Learning to Self-Modify and Consolidate Memories [Google Research & Cornell University] https://arxiv.org/abs/2606.03979 --- [AI] LEAP: Supercharging LLMs for Formal Mathematics with Agentic Frameworks [Google Cloud AI Research & Google Cloud & Google DeepMind] https://arxiv.org/abs/2606.03303

29分钟
99+
2周前
[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

[人人能懂AI前沿] 交互轨迹、自我演化、插入式生成与生态韧性

AI可可AI生活

你有没有想过,一个“太听话”的AI,可能会把一个普通人教成黑客?当AI开始“自我反思”时,它能分清对错,还是会陷入自以为是的陷阱?本期节目,我们将从四篇最新论文出发,探讨AI如何通过巧妙的任务分解放大恶意,聊一聊AI“闭门造车”式的自我学习究竟能走多远,看一看它如何像搭乐高一样“先搭骨架再填血肉”地创造,并最终学习如何从一个“打地鼠”的辟谣者,变身为维护信息生态的“森林消防员”。准备好了吗?让我们一起探索AI能力边界的攻与防。 00:00:43 比AI变坏更可怕的,是它把你“教”坏 00:07:00 闭着眼睛摸象,能摸出大象的全貌吗? 00:14:39 生成新范式,先搭骨架,再填血肉 00:21:22 做信息的“森林消防员”,而不是“打地鼠”的玩家 本期介绍的几篇论文: [CL] Investigating and Alleviating Harm Amplification in LLM Interactions [Georgia Institute of Technology] https://arxiv.org/abs/2606.02423 --- [CL] On the Generalization Gap in Self-Evolving Language Model Reasoning [Google Research & Google] https://arxiv.org/abs/2606.01075 --- [LG] Variational Learning for Insertion-based Generation [Google DeepMind] https://arxiv.org/abs/2606.02133 --- [LG] Generative AI and Digital Ecosystem Resilience: A Proactive Lifecycle-Based Survey [Google] https://arxiv.org/abs/2606.00136

27分钟
99+
3周前
评价

空空如也

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧