AI可可AI生活 - 节目列表

[人人能懂AI前沿] 给AI加个“方言包”,教它划重点,再看看它如何“走火入魔”

[人人能懂AI前沿] 给AI加个“方言包”,教它划重点,再看看它如何“走火入魔”

AI可可AI生活

你有没有感觉AI好像更懂英文,对中文有点“慢半拍”?这一期,我们就从几篇最新论文出发,聊聊如何用一个巧妙的“补丁”为我们的语言争取公平待遇。我们还会看看AI是如何像我们读书一样给长篇大论“划重点”的,以及AI在向我们学习时,是如何像一场大型选举一样,不小心选出了平庸的“最大公约数”。最后,我们还将揭示一个惊人现象:为什么AI的自我提升,努力到尽头竟是彻底的崩溃。 00:00:34 你的语言,正在被“区别对待” 00:06:21 大海捞针,如何给长篇大论划重点? 00:10:32 AI大模型是如何“被投票”选出来的? 00:16:35 AI如何理解世界,一个点,还是一群点? 00:22:10 AI的“过度努力”陷阱,为什么进步的尽头是崩溃? 本期介绍的几篇论文: [CL] LangMAP: A Language-Adaptive Approach to Tokenization [EPFL & University of Cambridge] https://arxiv.org/abs/2606.23566 --- [IR] Improving Long-Context Retrieval with Multi-Prefix Embedding [University of Waterloo & University of Queensland] https://arxiv.org/abs/2606.23642 --- [AI] AI Alignment From Social Choice Perspectives [Google Research & University of Southern California & Harvard University] https://arxiv.org/abs/2606.21550 --- [IR] Multi-Vector Embeddings are Provably More Expressive than Single Vector Embeddings [Google Research] https://arxiv.org/abs/2606.23475 --- [LG] Self-Improvement Can Self-Regress: The Rise-and-Collapse Failure Mode of LLM Self-Training [MetaAI] https://arxiv.org/abs/2606.21090

29分钟
83
4天前
[人人能懂AI前沿] 机器人如何“摸”到智慧?AI真的在思考吗?

[人人能懂AI前沿] 机器人如何“摸”到智慧?AI真的在思考吗?

AI可可AI生活

你是否也曾好奇,AI离拥有真正的“人性”还有多远?本期节目,我们将用几篇最新的论文,带你进行一次脑力激荡。我们会看到,如果用《帝国时代》里的绵羊也能搭建出一个AI,我们对它的“智能”判断是否会改变。接着,我们会探讨AI如何像我们一样学会“举一反三”,以及如何通过一套神奇的“外骨骼”,让机器人拥有人类的“手感”。最后,我们还会揭晓一种专为AI设计的“防作弊”考题,看看它到底是“原理型学霸”还是“题库型学霸”。准备好,让我们一起出发,探索AI认知的边界! 00:00:00 AI有灵魂吗?先问问“帝国时代”里的羊 00:06:03 AI的学习捷径,为什么“举一反三”比“死记硬背”更高效? 00:11:31 如何用“现在”的智慧,教会“过去”的自己 00:16:56 机器人摸着石头过河,靠的是什么? 00:21:50 你的模型,是真的懂了,还是在背题库? 本期介绍的几篇论文: [CL] If LLMs Have Human-Like Attributes, Then So Does Age of Empires II [Microsoft & The University of York] https://arxiv.org/abs/2605.31514 --- [LG] Learn from your own latents and not from tokens: A sample-complexity theory [EPFL & University of Cambridge & Johns Hopkins University] https://arxiv.org/abs/2605.27734 --- [LG] Pretraining Recurrent Networks without Recurrence [MIT] https://arxiv.org/abs/2606.06479 --- [RO] Universal Manipulation Exoskeleton: Learning Compliant Whole-body Policies with Real-time Torque Feedback [Ant Group] https://arxiv.org/abs/2606.14218 --- [LG] A Held-Out Transition-Pair Falsifier for Long-Horizon Non-Abelian State Tracking [Attractor Dynamics] https://arxiv.org/abs/2606.07254

28分钟
99+
6天前
[人人能懂AI前沿] AI如何深度思考?怎样成为说服大师?能创造游戏吗?

[人人能懂AI前沿] AI如何深度思考?怎样成为说服大师?能创造游戏吗?

AI可可AI生活

你有没有想过,一个更聪明的AI,是靠更大的模型,还是更深的“思考”?本期节目,我们将看到AI如何通过“反复打磨”超越百倍于自己的对手,如何用惊人的“信息密度”在辩论中战胜人类世界冠军。我们还会一起探索,当AI开始尝试建立自己的“世界观”、从零创造一个完整的游戏、甚至像我们一样行动时,一个怎样的新世界正在向我们走来。 00:00:29 聪明人的“笨功夫”,AI世界的新思考维度 00:06:39 那个最会“说话”的,已经不是人了 00:13:11 让AI拥有“世界观”,而不只是个“美图秀秀” 00:19:56 AI当“码农”可以,当“游戏制作人”呢? 00:25:33 向人学习,机器才能像人一样行动 本期介绍的几篇论文: [LG] Looped World Models [FaceMind Research Asia] https://arxiv.org/abs/2606.18208 [AI] AI systems out-persuade expert humans [University of Oxford & UK AI Security Institute & Stanford University] https://arxiv.org/abs/2606.16475 [AI] Kairos: A Native World Model Stack for Physical AI [Kairos Team] https://arxiv.org/abs/2606.16533 [CL] GameCraft-Bench: Can Agents Build Playable Games End-to-End in a Real Game Engine? [The Chinese University of Hong Kong & Shenzhen Loop Area Institute] https://arxiv.org/abs/2606.17861 [RO] Human Universal Grasping [New York University] https://arxiv.org/abs/2606.17054

31分钟
99+
1周前
[人人能懂AI前沿] 当AI开始说“电报”,做“清醒梦”,解“人性方程”

[人人能懂AI前沿] 当AI开始说“电报”,做“清醒梦”,解“人性方程”

AI可可AI生活

你有没有想过,AI之间开始说我们听不懂的“悄悄话”是为了什么?一个AI要学会新技能,最好的方法竟然是扔掉我们给它的“拐杖”?这期节目,我们就来聊聊几篇有趣的最新论文:看AI如何自创“电报文”实现高效沟通,用“清醒的梦”来检验学习成果,甚至尝试解开说服你的“人性方程”。准备好了吗?让我们一起探索AI正在发生的、超乎你想象的进化! 00:00:31 当机器开始说“电报”,AI沟通的下一次进化 00:05:06 AI学习的“断舍离”,扔掉“拐杖”,它能走得更远? 00:10:55 小模型的大道理,为什么30亿参数能挑战万亿巨头? 00:16:03 如何让机器人做一个“清醒的梦”? 00:21:51 想说服我?先解开这道“人性方程” 本期介绍的几篇论文: [CL] Large Language Models Do Not Always Need Readable Language [Shanghai Jiao Town University & The University of Sydney & Hefei University of Technology] https://arxiv.org/abs/2606.19857 --- [CV] You Don't Need Strong Assumptions: Visual Representation Learning via Temporal Differences [UIUC & New York University] https://arxiv.org/abs/2606.15956 --- [CL] VibeThinker-3B: Exploring the Frontier of Verifiable Reasoning in Small Language Models [Sina Weibo Inc] https://arxiv.org/abs/2606.16140 --- [RO] SC3-Eval: Evaluating Robot Foundation Models via Self-Consistent Video Generation [University of Toronto & Physical Intelligence & NVIDIA] https://arxiv.org/abs/2606.18610 --- [AI] Using Cognitive Models to Improve Language Model Simulation of Human Persuasion Games [Princeton University] https://arxiv.org/abs/2606.17657

28分钟
99+
1周前
[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

[人人能懂AI前沿] 给AI一面镜子、一张地图和一本“代码说明书”

AI可可AI生活

你是否想过,如何让“口是心非”的AI学会言行一致,又如何让手机App在“懂你”的同时做到“不认识你”?本期节目,我们将一起揭秘几篇最新论文,看看科学家们如何用“左右互搏”大法驯服AI,用“精准激励”破解AI的“中年危机”,甚至将AI的“直觉”直接翻译成我们能读懂的代码。准备好了吗?让我们一起出发! 00:00:27 驯服AI野马,从“口是心非”到“知行合一” 00:06:49 鱼与熊掌,如何让App既“懂你”又“不认识你”? 00:11:27 如何破解AI训练的“中年危机”? 00:16:48 让机器人学会“看样学样”,总共分几步? 00:22:52 把AI的“直觉”翻译成代码,会发生什么? 本期介绍的几篇论文: [LG] Self-CTRL: Self-Consistency Training with Reinforcement Learning [MIT CSAIL] https://arxiv.org/abs/2606.18327 --- [LG] Private Learning with Public Feature Conditioning [AWS Agentic AI & Microsoft & Google Research] https://arxiv.org/abs/2606.18773 --- [LG] STARE: Surprisal-Guided Token-Level Advantage Reweighting for Policy Entropy Stability [Tencent Hunyuan & Tsinghua University] https://arxiv.org/abs/2606.19236 --- [RO] Do as I Do: Dexterous Manipulation Data from Everyday Human Videos [UC Berkeley] https://arxiv.org/abs/2606.19333 --- [LG] Explaining Attention with Program Synthesis [NJIT & MIT EECS] https://arxiv.org/abs/2606.19317

28分钟
99+
1周前
[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

[人人能懂AI前沿] AI的翻译官、私教、侦探与裁判

AI可可AI生活

今天我们要聊点特别的,看看科学家们是如何用一些生活中的大智慧,来教AI学得更聪明。我们会探索四篇最新论文,看看如何给AI配一个靠谱的“数学翻译官”,让它不再胡说八道;又如何像一位金牌私教,通过“错题本”和“二选一”来因材施教。接着,我们会揭秘一种神奇的“反向学习法”,让AI通过观察就能比老师做得更好;最后,我们还会聊聊为什么给大模型一个“沙漏身材”,会比传统的“水桶身材”更高效。准备好了吗?让我们一起出发! 00:00:36 给AI装一个靠谱的数学翻译官 00:05:03 AI界的“因材施教”,如何让小模型学得更聪明? 00:10:32 如何让机器“反向”学习,变得比老师更聪明? 00:16:08 只看结果,你可能错过了真正的第一名 00:22:15 AI大模型的新身材,为什么“沙漏”比“水桶”好? 本期介绍的几篇论文: [LG] Visored: A Controlled-Natural-Language Prover for LLM-Generated Mathematics [University of Washington] https://arxiv.org/abs/2606.17581 --- [CL] Zone of Proximal Policy Optimization: Teacher in Prompts, Not Gradients [NVIDIA] https://arxiv.org/abs/2606.18216 --- [LG] Reversal Q-Learning [UC Berkeley] https://arxiv.org/abs/2606.17551 --- [LG] Offline Preference-Based Trajectory Evaluation [CMU] https://arxiv.org/abs/2606.17541 --- [CL] Variable-Width Transformers [MIT] https://arxiv.org/abs/2606.18246

28分钟
93
1周前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧