AI可可AI生活 - 节目列表

[人人能懂AI前沿] 给AI加个“方言包”,教它划重点,再看看它如何“走火入魔”

[人人能懂AI前沿] 给AI加个“方言包”,教它划重点,再看看它如何“走火入魔”

AI可可AI生活

你有没有感觉AI好像更懂英文,对中文有点“慢半拍”?这一期,我们就从几篇最新论文出发,聊聊如何用一个巧妙的“补丁”为我们的语言争取公平待遇。我们还会看看AI是如何像我们读书一样给长篇大论“划重点”的,以及AI在向我们学习时,是如何像一场大型选举一样,不小心选出了平庸的“最大公约数”。最后,我们还将揭示一个惊人现象:为什么AI的自我提升,努力到尽头竟是彻底的崩溃。 00:00:34 你的语言,正在被“区别对待” 00:06:21 大海捞针,如何给长篇大论划重点? 00:10:32 AI大模型是如何“被投票”选出来的? 00:16:35 AI如何理解世界,一个点,还是一群点? 00:22:10 AI的“过度努力”陷阱,为什么进步的尽头是崩溃? 本期介绍的几篇论文: [CL] LangMAP: A Language-Adaptive Approach to Tokenization [EPFL & University of Cambridge] https://arxiv.org/abs/2606.23566 --- [IR] Improving Long-Context Retrieval with Multi-Prefix Embedding [University of Waterloo & University of Queensland] https://arxiv.org/abs/2606.23642 --- [AI] AI Alignment From Social Choice Perspectives [Google Research & University of Southern California & Harvard University] https://arxiv.org/abs/2606.21550 --- [IR] Multi-Vector Embeddings are Provably More Expressive than Single Vector Embeddings [Google Research] https://arxiv.org/abs/2606.23475 --- [LG] Self-Improvement Can Self-Regress: The Rise-and-Collapse Failure Mode of LLM Self-Training [MetaAI] https://arxiv.org/abs/2606.21090

29分钟
83
1天前
[人人能懂AI前沿] 机器人如何“摸”到智慧?AI真的在思考吗?

[人人能懂AI前沿] 机器人如何“摸”到智慧?AI真的在思考吗?

AI可可AI生活

你是否也曾好奇,AI离拥有真正的“人性”还有多远?本期节目,我们将用几篇最新的论文,带你进行一次脑力激荡。我们会看到,如果用《帝国时代》里的绵羊也能搭建出一个AI,我们对它的“智能”判断是否会改变。接着,我们会探讨AI如何像我们一样学会“举一反三”,以及如何通过一套神奇的“外骨骼”,让机器人拥有人类的“手感”。最后,我们还会揭晓一种专为AI设计的“防作弊”考题,看看它到底是“原理型学霸”还是“题库型学霸”。准备好,让我们一起出发,探索AI认知的边界! 00:00:00 AI有灵魂吗?先问问“帝国时代”里的羊 00:06:03 AI的学习捷径,为什么“举一反三”比“死记硬背”更高效? 00:11:31 如何用“现在”的智慧,教会“过去”的自己 00:16:56 机器人摸着石头过河,靠的是什么? 00:21:50 你的模型,是真的懂了,还是在背题库? 本期介绍的几篇论文: [CL] If LLMs Have Human-Like Attributes, Then So Does Age of Empires II [Microsoft & The University of York] https://arxiv.org/abs/2605.31514 --- [LG] Learn from your own latents and not from tokens: A sample-complexity theory [EPFL & University of Cambridge & Johns Hopkins University] https://arxiv.org/abs/2605.27734 --- [LG] Pretraining Recurrent Networks without Recurrence [MIT] https://arxiv.org/abs/2606.06479 --- [RO] Universal Manipulation Exoskeleton: Learning Compliant Whole-body Policies with Real-time Torque Feedback [Ant Group] https://arxiv.org/abs/2606.14218 --- [LG] A Held-Out Transition-Pair Falsifier for Long-Horizon Non-Abelian State Tracking [Attractor Dynamics] https://arxiv.org/abs/2606.07254

28分钟
99+
2天前
[人人能懂AI前沿] AI如何深度思考?怎样成为说服大师?能创造游戏吗?

[人人能懂AI前沿] AI如何深度思考?怎样成为说服大师?能创造游戏吗?

AI可可AI生活

你有没有想过,一个更聪明的AI,是靠更大的模型,还是更深的“思考”?本期节目,我们将看到AI如何通过“反复打磨”超越百倍于自己的对手,如何用惊人的“信息密度”在辩论中战胜人类世界冠军。我们还会一起探索,当AI开始尝试建立自己的“世界观”、从零创造一个完整的游戏、甚至像我们一样行动时,一个怎样的新世界正在向我们走来。 00:00:29 聪明人的“笨功夫”,AI世界的新思考维度 00:06:39 那个最会“说话”的,已经不是人了 00:13:11 让AI拥有“世界观”,而不只是个“美图秀秀” 00:19:56 AI当“码农”可以,当“游戏制作人”呢? 00:25:33 向人学习,机器才能像人一样行动 本期介绍的几篇论文: [LG] Looped World Models [FaceMind Research Asia] https://arxiv.org/abs/2606.18208 [AI] AI systems out-persuade expert humans [University of Oxford & UK AI Security Institute & Stanford University] https://arxiv.org/abs/2606.16475 [AI] Kairos: A Native World Model Stack for Physical AI [Kairos Team] https://arxiv.org/abs/2606.16533 [CL] GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] https://arxiv.org/abs/2606.17861 [RO] Human Universal Grasping [New York University] https://arxiv.org/abs/2606.17054

31分钟
99+
3天前
[人人能懂AI前沿] 当AI开始说“电报”,做“清醒梦”,解“人性方程”

[人人能懂AI前沿] 当AI开始说“电报”,做“清醒梦”,解“人性方程”

AI可可AI生活

你有没有想过,AI之间开始说我们听不懂的“悄悄话”是为了什么?一个AI要学会新技能,最好的方法竟然是扔掉我们给它的“拐杖”?这期节目,我们就来聊聊几篇有趣的最新论文:看AI如何自创“电报文”实现高效沟通,用“清醒的梦”来检验学习成果,甚至尝试解开说服你的“人性方程”。准备好了吗?让我们一起探索AI正在发生的、超乎你想象的进化! 00:00:31 当机器开始说“电报”,AI沟通的下一次进化 00:05:06 AI学习的“断舍离”,扔掉“拐杖”,它能走得更远? 00:10:55 小模型的大道理,为什么30亿参数能挑战万亿巨头? 00:16:03 如何让机器人做一个“清醒的梦”? 00:21:51 想说服我?先解开这道“人性方程” 本期介绍的几篇论文: [CL] Large Language Models Do Not Always Need Readable Language [Shanghai Jiao Town University & The University of Sydney & Hefei University of Technology] https://arxiv.org/abs/2606.19857 --- [CV] You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences [UIUC & New York University] https://arxiv.org/abs/2606.15956 --- [CL] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models [Sina Weibo Inc] https://arxiv.org/abs/2606.16140 --- [RO] SC3-Eval: Evaluating Robot Foundation Models via Self-Consistent Video Generation [University of Toronto & Physical Intelligence & NVIDIA] https://arxiv.org/abs/2606.18610 --- [AI] Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games [Princeton University] https://arxiv.org/abs/2606.17657

28分钟
99+
4天前
[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

AI可可AI生活

你是否想过,如何让“口是心非”的AI学会言行一致,又如何让手机App在“懂你”的同时做到“不认识你”?本期节目,我们将一起揭秘几篇最新论文,看看科学家们如何用“左右互搏”大法驯服AI,用“精准激励”破解AI的“中年危机”,甚至将AI的“直觉”直接翻译成我们能读懂的代码。准备好了吗?让我们一起出发! 00:00:27 驯服AI野马,从“口是心非”到“知行合一” 00:06:49 鱼与熊掌,如何让App既“懂你”又“不认识你”? 00:11:27 如何破解AI训练的“中年危机”? 00:16:48 让机器人学会“看样学样”,总共分几步? 00:22:52 把AI的“直觉”翻译成代码,会发生什么? 本期介绍的几篇论文: [LG] Self-CTRL: Self-Consistency Training with Reinforcement Learning [MIT CSAIL] https://arxiv.org/abs/2606.18327 --- [LG] Private Learning with Public Feature Conditioning [AWS Agentic AI & Microsoft & Google Research] https://arxiv.org/abs/2606.18773 --- [LG] STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability [Tencent Hunyuan & Tsinghua University] https://arxiv.org/abs/2606.19236 --- [RO] Do as I Do: Dexterous Manipulation Data from Everyday Human Videos [UC Berkeley] https://arxiv.org/abs/2606.19333 --- [LG] Explaining Attention with Program Synthesis [NJIT & MIT EECS] https://arxiv.org/abs/2606.19317

28分钟
99+
6天前
[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

AI可可AI生活

今天我们要聊点特别的,看看科学家们是如何用一些生活中的大智慧,来教AI学得更聪明。我们会探索四篇最新论文,看看如何给AI配一个靠谱的“数学翻译官”,让它不再胡说八道;又如何像一位金牌私教,通过“错题本”和“二选一”来因材施教。接着,我们会揭秘一种神奇的“反向学习法”,让AI通过观察就能比老师做得更好;最后,我们还会聊聊为什么给大模型一个“沙漏身材”,会比传统的“水桶身材”更高效。准备好了吗?让我们一起出发! 00:00:36 给AI装一个靠谱的数学翻译官 00:05:03 AI界的“因材施教”,如何让小模型学得更聪明? 00:10:32 如何让机器“反向”学习,变得比老师更聪明? 00:16:08 只看结果,你可能错过了真正的第一名 00:22:15 AI大模型的新身材,为什么“沙漏”比“水桶”好? 本期介绍的几篇论文: [LG] Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics [University of Washington] https://arxiv.org/abs/2606.17581 --- [CL] Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients [NVIDIA] https://arxiv.org/abs/2606.18216 --- [LG] Reversal Q-Learning [UC Berkeley] https://arxiv.org/abs/2606.17551 --- [LG] Offline Preference-Based Trajectory Evaluation [CMU] https://arxiv.org/abs/2606.17541 --- [CL] Variable-Width Transformers [MIT] https://arxiv.org/abs/2606.18246

28分钟
93
1周前
[人人能懂AI前沿] 从数据主旋律、训练菜谱到探索式学习

[人人能懂AI前沿] 从数据主旋律、训练菜谱到探索式学习

AI可可AI生活

你有没有想过,我们该如何“教育”一个AI?是让它死记硬背标准答案,还是给它海量数据让它自己野蛮生长?今天,我们就从几篇最新的AI论文出发,像一位精明的“AI成长规划师”,探讨如何让AI学得更聪明、更深刻。我们将一起揭开AI在猜谜游戏中的意外“短板”,学习如何为它定制一份防止“偏科”的训练菜谱,并探索一种比标准答案更重要的“过程奖励”机制。 00:00:32 你以为AI很聪明?它可能连猜谜游戏都玩不好 00:05:54 聪明AI的“偏科”难题 00:10:57 数据太多喂不饱AI?你需要找到主旋律 00:15:45 AI军备竞赛,真正的决胜点,在你看不到的数据战场 00:20:52 比“标准答案”更重要的东西 本期介绍的几篇论文: [CL] Can LLM Agents Infer World Models? Evidence from Agentic Automata Learning [The Hebrew University of Jerusalem & New York University] https://arxiv.org/abs/2606.16576 --- [LG] How Post-Training Shapes Biological Reasoning Models [Harvard University] https://arxiv.org/abs/2606.16517 --- [LG] Active Learning with Low-Rank Structure for Data Selection [Google Research & UC Berkeley] https://arxiv.org/abs/2606.16045 --- [CL] Spokes: Optimizing for Diverse Pretraining Data Selection [DSO National Laboratories & Stanford University & University of Washington] https://arxiv.org/abs/2606.15216 --- [LG] ExpRL: Exploratory RL for LLM Mid-Training [Stanford University & CMU & OpenAI] https://arxiv.org/abs/2606.17024

27分钟
99+
1周前
[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

[人人能懂AI前沿] AI的瘦身术、组织图与紧箍咒

AI可可AI生活

你有没有想过,我们如何给AI这头“吞金兽”来一次彻底的瘦身和压缩?如何为它设计一张分工明确的“组织架构图”,让“调度员”和“专家”各司其职?我们又该如何给它装上一个既能规避灾难性风险,又能动态调整预算的“安全大脑”?当AI自己当上“裁判”时,我们如何确保它不是在抛硬币?本期节目,我们将通过几篇最新的研究,一起探索如何让AI变得更高效、更聪明,也更可靠。 00:00:31 驯服AI的新兵法,“共享”与“压缩” 00:06:36 给AI画一张“组织架构图”,谁是调度员,谁是专家? 00:13:07 如何让AI既能干,又不出事? 00:18:11 AI当裁判,是明察秋毫,还是抛硬币? 00:23:49 给AI上好“紧箍咒”,它才能学得又快又稳 本期介绍的几篇论文: [LG] Gefen: Optimized Stochastic Optimizer [Reichman University & Tel Aviv University] https://arxiv.org/abs/2606.13894 --- [LG] A theoretical model for task routing in mixture-of-expert transformers [University of Sydney & Zhejiang University] https://arxiv.org/abs/2606.14398 --- [LG] Utility-Constrained Policy Optimization [York University & Google DeepMind] https://arxiv.org/abs/2606.14029 --- [CL] The Coin Flip Judge? Reliability and Bias in LLM-as-a-Judge Evaluation [A Yagubyan] https://arxiv.org/abs/2606.13685 --- [LG] Diffusion Policy Optimization without Drifting Apart [UC Berkeley] https://arxiv.org/abs/2606.13795

30分钟
99+
1周前
[人人能懂AI前沿] AI的成长三部曲:学会约束、学会思考、学会记忆

[人人能懂AI前沿] AI的成长三部曲:学会约束、学会思考、学会记忆

AI可可AI生活

如果AI像个学生,我们该如何教育它?本期节目,我们将一起探索几篇最新论文带来的惊人答案:我们将看到,如何用一根充满智慧的“弹力绳”防止AI“学疯了”;如何用一棵“假设树”教会AI像科学家一样累积经验;我们还会举办一场AI记忆力大赛,看看究竟是“死记硬背”还是“内在结构”更胜一筹;最后,我们将揭示一种让AI“开卷的我”去教“闭卷的我”的神奇训练法,并学会如何像外科医生一样,为AI精准“切除”坏习惯。准备好了吗?让我们一起看看,人类是如何教会AI“学习如何学习”的。 00:00:42 AI“学疯了”怎么办?一根“弹力绳”的智慧 00:06:42 如何让AI像科学家一样思考? 00:13:26 你的记忆,是“看过”还是“记住”了? 00:19:22 AI训练的新思路,优等生是如何“开卷”带“闭卷”的? 00:25:10 我们给AI的“好评”,正在让它变“笨”吗? 本期介绍的几篇论文: [LG] Rethinking the Divergence Regularization in LLM RL [Tencent Hunyuan & NUS] https://arxiv.org/abs/2606.09821 --- [CL] Toward Generalist Autonomous Research via Hypothesis-Tree Refinement [Microsoft Research & Renmin University of China] https://arxiv.org/abs/2606.11926 --- [CV] Echo-Memory: A Controlled Study of Memory in Action World Models [The University of Hong Kong & Joy Future Academy, JD & The Chinese University of Hong Kong] https://arxiv.org/abs/2606.09803 --- [LG] Rubric-Guided Self-Distillation: Post-Training Without Rubric Verifiers [Scale AI] https://arxiv.org/abs/2606.12507 --- [LG] Anatomy of Post-Training: Using Interpretability to Characterize Data and Shape the Learning Signal [GOODFIRE] https://arxiv.org/abs/2606.12360

32分钟
99+
1周前
[人人能懂AI前沿] 给AI装上“第六感”:从感知、记忆到协作的全面升级

[人人能懂AI前沿] 给AI装上“第六感”:从感知、记忆到协作的全面升级

AI可可AI生活

你有没有想过,未来的AI不再只是一个“大力士”,而是一个善用巧劲的“策略家”?本期节目,我们将一起探寻几篇最新论文,看看AI如何学会像我们一样“抓重点”来读懂万字长文,又如何通过一个“共享白板”实现高效团队协作。我们还会揭秘,AI怎样无中生有地获得“第六感”,如何靠着一本“记忆草稿本”创作出不会失忆的长视频,以及它又是怎样得到一支“魔法棒”,能对你的文章进行外科手术般的精准修改。准备好了吗?让我们一起看看AI是如何变聪明的! 00:00:39 你的手机,是怎么“偷懒”变聪明的? 00:05:03 人多不一定力量大,但“会开会”的团队可以 00:11:33 给机器装上“第六感”,一种更聪明的学习方式 00:18:02 AI做长视频,怎样才能不“失忆”? 00:23:18 给AI一支“局部修改”的魔法棒 本期介绍的几篇论文: [LG] MiniMax Sparse Attention: MiniMax is a surprisingly effective reward for instruction following [MiniMax] https://arxiv.org/abs/2606.13392 --- [LG] Decentralized Multi-Agent Systems with Shared Context: Decentralized Multi-Agent Systems with Shared Context [Stanford University] https://arxiv.org/abs/2606.10662 --- [RO] FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning: FACTR 2: Learning External Force Sensing for Commodity Robot Arms Improves Policy Learning [CMU] https://arxiv.org/abs/2606.12406 --- [CV] MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation: MilliVid: Hierarchical Latents for Long-Range Consistency in Video Generation [MIT & Toyota Research Institute] https://arxiv.org/abs/2606.09056 --- [CL] TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering: TimpaTeks: Automatic In-place Text Sequence Modification via Diffusion Language Model Steering [MBZUAI] https://arxiv.org/abs/2606.08408

29分钟
99+
1周前
[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

[人人能懂AI前沿] AI的未来地图、奥运会、炼金术与品格试金石

AI可可AI生活

你有没有想过,当AI变得比我们更聪明时,它会是什么样子?我们又该如何为五花八门的AI办一场公平的“奥运会”?本期节目,我们将一起探索通往超级智能的四条可能路径,看看科学家们如何将“炼丹”般的AI调参过程,变成“看图施工”的科学方法。我们还会揭秘一种让AI画画速度更快、质量不变的“师徒协作”新技巧,并最终探讨一个深刻的问题:当我们向AI寻求人生建议时,它究竟是智慧的“诸葛亮”,还是只想讨好你的“马屁精”? 00:00:36 AI的下一站,以及通往未来的四条路 00:06:20 如何给AI办一场公平的“奥运会”? 00:11:43 AI调参,从“炼丹玄学”到“看图施工” 00:16:30 AI画画慢?一种“组团验收”的加速心法 00:24:05 如何判断你的AI顾问,是“诸葛亮”还是“马屁精”? 本期介绍的几篇论文: [AI] From AGI to ASI [Google DeepMind] https://arxiv.org/abs/2606.12683 --- [AI] AgentBeats: Agentifying Agent Assessment for Openness, Standardization, and Reproducibility [UC Berkeley & University of California, Santa Cruz] https://arxiv.org/abs/2606.13608 --- [LG] LoRA-Muon: Spectral Steepest Descent on the Low-Rank Manifold [EleutherAI] https://arxiv.org/abs/2606.12921 --- [LG] Accelerating Speculative Diffusions via Block Verification [Google Research & Google DeepMind] https://arxiv.org/abs/2606.13426 --- [LG] Normative Robustness as a Frontier for Non-Verifiable Reasoning in LLMs [Google DeepMind & Imperial College London] https://arxiv.org/abs/2606.12731

30分钟
99+
1周前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧