节目

你喜欢的节目都在这里

20260430金融科技动向:老年客群分层与对应产品匹配

今日金融科技动向

20260430金融科技动向 明天五一,读完今天的,我们就节后见啦~ 政策关注 1、上海清算所 利率衍生品集中清算系统将上线功能 行业动态 2、BILL旅行报销 3、老年客群分层与对应产品匹配 政策关注 1、上海清算所 利率衍生品集中清算系统将上线功能 功能:业务账户上进行合并实现统一登录和统一结算指令,包含利率互换、标准债券远期与标准利率互换;风险管理中引入保证金定向余额管理日间持仓限额实施更新、会员端日间风险监测;利率衍生品方面新业务暂未对外披露。 行业动态 2、BILL旅行报销 亮点:与航空公司、酒店等预定打通,支持预定、预算、卡片控制和费用管理、单证ocr识别和智能分类、应收账款自动开票催款并跟踪付款状态、卡片可以设置实体卡+虚拟卡方便部门分账和额度控制;另外支持信用贷和存款、返现。 3、老年客群分层与对应产品匹配 亮点:(1)客群分层:60-70岁低龄活力老人,关注资产增值与生活服务需求,产品为个人养老金账户、R2级以下养老专属理财搭配旅居等权益、养老规划服务及中期资产配置;71-80岁中龄半自理老人,关注现金流稳定与医疗支持需求,产品为按月付息的存单、保本型储蓄产品搭配高额医疗意外险、长期护理险、上门理财咨询、医保结算协助;80岁以上高龄失能老人,关注资金安全与照护支付需求,产品为保本保息的储蓄产品、监护人账户服务、联动康养机构的金融+照护服务;本地高净值养老客群,关注财富传承与高端医疗需求,产品为家族简易信托、大额年金险、一站式财产规划、遗嘱订立、私享金融顾问高端医疗资源对接(2)区域分层:结合区域特色设置权益,如养老理财+康养基地入住权、村集体的村社养老存单、旅居热门地区的异地养老一卡通(3)养老金融专员能力:养老政策解读、基础资产配置、老年心理沟通、防诈骗知识、医养资源对接;此外可联动内部理财师、保险顾问、外部医生、康养顾问一站式服务。 欢迎加入群聊,每日阅读最新动向

2分钟
3
1周前

ClimbHerAge|01.攀岩与我们的中女时代

一起爬V8!|专注攀岩x心理学&女性

当中女遇上攀岩。我们为什么攀岩?攀岩时的我们是怎样的?我们在攀岩中追求什么? 《Climb Her Age》是由“一起爬V8!”和“磕线同谋”两个攀岩主题播客共同发起的一次“中女联动”。 这是一个融合女性主义视角、运动科学与身体叙事的系列节目,聚焦30+女性在攀岩运动中的真实体验: 从激素波动与训练状态,到神经可塑性如何对抗“年龄魔咒”; 从周期化训练策略,到“不节食的强壮身体”如何成为可能。 这不是攀岩教学课,而是一场关于中女进步可能性的开放讨论。30岁开始攀岩晚了吗?我们还能变强吗?我们还能变多强? 我们备战不了IFSC,但备战自己的人生还不晚。进步,是一种身体主权的重塑。 第一期,我们从30+女性开始认真训练的现象聊起。为什么中女开始投入力量训练、跑步、攀岩、记录身体20岁时的运动和30岁之后有什么不同? 这不是单纯的“开始运动”,而是女性第一次开始认真对待自己的身体。 —— 🧗‍♀️主播🎙️ 柯晗,认知心理学和神经科学博士,日本国立研究所助理教授,岩龄6年 珊珊,“磕线同谋”主播,岩龄7年,9B club成员 感谢MAIA ACTIVE对本期的支持。 感谢接受采访、分享自己经历的Yue、cc、黑黑、顾老师和凡凌。 🧗‍♀️时间轴💪 00:03 Into,主播介绍 02:14 为什么30+、40+,女性突然开始认真训练? 成家,成为母亲,职业发展稳定。生活结构水到渠成,经济条件和身份及自我叙事的转变。从被观看到自我体验,攀岩时的我是怎样的。 14:00 为什么是攀岩? 一种与自己对话的锻炼方式:场地和社群的灵活性、浑然天成的增肌塑形、解题过程的趣味性、持续正反馈,以及身体能力被不断开发的可能性。 32:00 当我们在说变强时,我们在说什么 攀岩中的男女差异、30岁开始是否太晚。中女如何与生理周期和生命周期周旋,发展属于自己的变强策略。 49:00 攀岩为什么成为一个女性表达主体性的运动? 在全球女性意识觉醒的背景下,“进步”是否也是一种身份建构?我们为什么说,攀岩不是在复制标准,而是在生成自我? 未来主题预告:荷尔蒙,训练计划,神经可塑性等 55:00 中女岩友们的分享和抽奖信息 Yue:因为攀岩伤病而大龄留学学习物理治疗的人生经历 - 🧗‍♀️后期✍️: 珊珊@【磕线同谋】 - 📢欢迎在小宇宙、苹果播客、Spotify等平台关注我们和“磕线同谋”。 🧗‍♀️“一起爬V8!”|可能是心理学上最专业的两个女岩友,专注【攀岩x 心理学】&【攀岩 x 女性】。

84分钟
99+
1周前

#514.DeepMind创始人Demis Hassabis谈AGI、AlphaFold与科学发现的未来

跨国串门儿计划

📝 本期播客简介 本期我们克隆的是 Y Combinator 官方播客的一期深度对谈。Demis Hassabis: Agents, AGI & The Next Big Scientific Breakthrough 主持人 Gary 是 YC 的 CEO,嘉宾 Demis Hassabis 是 DeepMind 的联合创始人兼 CEO,他因破解生物学上长达五十年的蛋白质结构预测难题,在去年获得了诺贝尔化学奖。 在这期节目里,你将听到 Demis Hassabis 从国际象棋神童、游戏设计师到诺奖得主的传奇经历,以及他对通用人工智能的终极思考。对话深入探讨了当前 AI 系统缺失的关键组件——持续学习、长期推理和记忆;他独家披露了 DeepMind 如何将其在 AlphaGo 上验证过的强化学习和搜索哲学,融入当今最先进的 Gemini 大模型。此外,他还分享了小模型的“蒸馏”艺术、智能体的真实进展,以及 AI 将在未来五年如何彻底变革材料科学、药物发现等基础科学领域。对于每一位正在科技前沿探索的创始人,Demis 给出了一条至关重要的建议:在 AGI 可能于途中降临的时代,你该如何预判技术走向,构建真正具有防御性的深度科技公司。 👨‍⚕️ 本期嘉宾 Demis Hassabis,Google DeepMind 联合创始人兼 CEO,2024年诺贝尔化学奖得主。他从小是国际象棋神童,17岁便设计了畅销游戏《主题公园》,后来获得认知神经科学博士学位,并于2010年创立 DeepMind,致力于“解决智能问题”。他领导的团队开发了击败世界围棋冠军的 AlphaGo 和破解蛋白质结构预测难题的 AlphaFold,后者已被全球超过三百万研究人员使用,被誉为 AI 加速科学发现的里程碑。目前,他正带领团队打造 Gemini 模型,并继续朝着通用人工智能的宏大目标前进。 ⏱️ 时间戳 开场与嘉宾传奇 00:00 开场:Y Combinator播客简介与Demis Hassabis的非凡成就 03:30 Demis的职业生涯回顾:从棋坛神童到认知神经科学博士,再到DeepMind创立 05:00 AlphaGo与AlphaFold:两个改变世界对AI认知的里程碑 06:30 诺奖背后:免费开放AlphaFold,赋能全球每一位科学家 AGI架构的未来拼图 07:15 当前范式的局限:大模型还缺什么?持续学习、长期推理与记忆 09:45 “梦境循环”与海马体:神经科学启发下的经验重放技术 12:30 上下文窗口是终极方案吗?工作记忆的蛮力模拟与信息检索成本 15:00 生物大脑不是机器:完美记忆的承诺与逻辑成本困境 从AlphaGo到Gemini:强化学习的回归 17:45 智能体的原始基因:Atari游戏与AlphaGo如何定义自主系统 19:45 “想太多”的模型:在思维链中如何避免循环错误 22:00 强化学习被低估了吗?将游戏策略泛化到世界模型 24:00 AlphaZero的旧思想与当今基础模型的新结合 超高效的小模型:蒸馏的艺术 26:30 从庞大前沿模型到轻量级Flash:蒸馏技术的极限在哪? 28:30 为何必须极致高效:服务数十亿用户的谷歌生态与低延迟刚需 30:30 速度优于绝对能力:迭代效率如何弥补5%的能力差距 32:00 隐私与安全:设备端小模型的战略意义 智能体时代的黎明 35:00 智能体真实能力:到底是炒作还是真正的起步? 37:00 人机协作:为什么还没出现“AI造出的爆款游戏”? 38:45 失踪的创造火花:一个能发明“围棋”的系统何时到来? 40:15 工具的灵魂:人类品味与创造力的不可或缺 多模态、开源与设备端模型 43:30 从Gemini到Gemma:开放科学基因与开源模型战略 46:00 为何开放边缘模型?部署风险与安卓、机器人的全球布局 48:00 多模态先见:如何让AI理解物理世界并遥遥领先 AI与基础科学的下一个突破口 51:00 AlphaFold的范式:组合搜索空间、清晰目标函数与合成数据 53:30 迈向虚拟细胞:我们需要什么样的活细胞成像技术? 56:00 未来五年最具变革潜力的科学领域:材料、气候与数学 58:00 根节点问题:如何用AI解锁全新科学发现的分支 给深科技创始人的忠告 01:00:30 预测AI走向与跨学科结合:如何构建不被基础模型吞没的护城河 01:03:00 拥抱深度科技:真正有价值的事从不简单,相信你的另类视角 01:06:30 为自己热爱的事业而战:即使技术未成,你也会找到继续的路 01:08:30 终极建议:在AGI终点途中启动你的深科技征程 终极挑战:科学推理与AI的创造力 01:10:30 系统能否自己提出“黎曼假设”?超越模式匹配的科学推理 01:13:00 “爱因斯坦测试”:训练截止1901年的模型,它会发现狭义相对论吗? 01:16:00 通用工具与专用系统的未来:为何AGI不应是一个巨无霸大脑 🌟 精彩内容 💡 AGI的最终架构:还缺哪几块拼图? Demis 明确指出,尽管当前的大规模预训练、RLHF和思维链范式已非常强大,但要实现完全的通用智能,我们还必须攻克持续学习、长期推理和更高效稳定的记忆机制。“我觉得现有的组件会是AGI最终架构的一部分,但可能还需要一两个重大的想法去突破。” 🧠 从神经科学借来的AI灵感 Demis 结合其认知神经科学的博士背景,解释了DeepMind早期突破的核心概念——“经验重放”如何源于对大脑海马体在睡眠中巩固记忆的研究。这一在2013年被用于Atari游戏AI DQN的 “远古时期”突破,至今仍对克服模型的“无状态”难题具有深刻启发。 🚀 小模型的大智慧与蒸馏的极限 当被问及小模型的聪明程度是否有极限时,Demis 乐观地表示目前远未触及信息密度的天花板。“我们的一款前沿模型发布半年到一年后,你就能在那种非常小、几乎能跑在设备端的模型里看到同样的能力。” 这不仅关乎成本,更关乎速度与隐私,他认为设备端高效模型加云端强大模型协调将是理想的终局。 ♟️ 当AI“想太多”:从国际象棋的错误说开去 Demis 分享了与Gemini下棋的有趣观察:模型有时会意识到某步是臭棋,但因找不到更好的选择而依然走出那一步。“在一个精确的推理系统里,你根本不应该看到这种事……我总觉得它对自己的思考过程缺少一种内省。” 这反映了当前系统推理能力的“锯齿状”特征。 🔬 科学发现的下一个“AlphaFold时刻” Demis 提出了他所寻找的科学突破范式:一个巨大的组合搜索空间、一个明确定义的目标函数、以及足够的数据或合成数据模拟器。他预测在材料科学、药物发现等领域,我们正处于类似AlphaFold爆发前的“临门一脚”时刻,并给出了“十年内实现完整虚拟细胞”的具体时间线。 💎 创始人的黄金法则:预判AI,拥抱深科技 对于创业者,Demis 的建议直击要害:“你必须预判 AI 技术的发展走向。” 他认为,将AI与某个深度技术领域(如材料、医药)相结合的跨学科团队,将最具防御性,不会轻易被基础模型的下一次更新淹没。此外,他鼓励所有人将生命投入到“如果你不做就不会有人去推动、真正能改变世界的事情”上。 🌐 播客信息补充 翻译克隆自:Y Combinator 官方播客 本播客采用原有人声声线进行播客音频制作,也可能会有一些地方听起来怪怪的 使用 AI 进行翻译,因此可能会有一些地方不通顺; 如果有后续想要听中文版的其他外文播客,也欢迎联系微信:iEvenight

34分钟
1k+
1周前

刘轩:我喝了几十年的水,原来全喝错了

刘轩的Howto人生学

这两天刚从台湾飞回纽约,回到家,第一件事就是倒一杯水来喝。 很有趣。以前我根本不太会想这件事。水就是水,能解渴就好。年轻的时候,冰的、热的、瓶装的、自来水,好像差别都不大。但这几年我越来越明显地感觉到,水真的有差,而且有时候,那个差别比你想象中还大。 住在纽约久了,你会发现,这里很多人对喝水这件事其实很随性。有人直接喝水龙头的水,有人习惯买瓶装水,也有人对某几个牌子的水特别执着。 在台湾就很不一样,为什么我们这么习惯煮水? 但问题是,我们每天都在喝水,却未必真的知道自己喝下去的是什么。 所以这期,我邀请到两位很特别的来宾:品水师夏豪均Howard和品水师吴侑谕Yvonne。两位都是取得国际认证的品水师,Yvonne更是台湾第一位女性品水师。 录音那天,他们直接扛了三支水进录音室,带我现场盲品。新西兰的Antipodes、西班牙的22、法国的Saint-Jean。一支清爽,一支厚重,带一点涩感,一支则是气泡细致到让你愣一下:这真的只是水吗? 那一刻我才发现,我们平常对水真的太粗心了。 这一集,我们聊了很多你平常不太会认真想、但其实非常贴近生活的问题: 台湾的自来水到底好不好? 为什么台湾人这么习惯煮水? TDS是什么? 碱性水真的能改变体质吗?(答案可能跟你想的不一样。) 后面还聊到一瓶他们两个喝过最贵的水,要价二十几万台币。到底是哪里来的水,竟然可以有这样的天价? 这次的对话真的很有趣。我相信你听完之后,下次再喝下一口水,感觉可能会有点不一样。 那播客的开头,也直接用刘老师自己的这段了

58分钟
99+
1周前

Ep54(I).互动追凶:苏公馆碎镜案|纯原创微剧本

BingoBingo

本期内容分上下集。 【本期主播】 言上/粥粥 【本期嘉宾】 暖暖/竹间 【内容提要】 锵锵!大家五一快乐! BingoBingo带着原创微剧本来噜! 一张碎镜、一个假面舞会、十年前的灭门惨案 超多疑点和线索,到底谁才是这起案件的真凶! 【案件相关】 由于线索较多,展示部分在此,方便大家对照沉浸式推理案件! 更多案件详情可关注公众号「BingoBingo播客」获取! 「背景提要」 民国二十三年,腊月二十三,小年夜。上海滩名媛苏曼莎在自家公馆举办假面舞会。 午夜钟声敲响时,尖叫声划破了公馆的浮华——苏曼莎倒在三楼画室的血泊中,胸口插着一把拆信刀。 诡异的是,画室里那面古董穿衣镜,竟在她死后裂开了无数裂痕。每一片碎片里,都映着不同的倒影。 今晚在场的四位——百乐门歌女白露、私人秘书沈秋棠、新锐画家顾云笙、申报记者陆明远——都被困在了这座公馆里。 「死者报告」 1. 苏曼莎,原名苏小曼,无锡人,父母双亡,在戏班长大。 2. 民国十三年被白仲卿纳为继室,时年十八岁。 3. 白家十年前白老爷白仲卿毒发身亡,大小姐白双双悲伤投井自尽。二小姐白秀秀被送往教会读书,教会学校意外失火二小姐也在其中。 4. 白家出事后,苏小曼携财产来上海,改名苏曼莎。 「尸体状况」 苏曼莎被发现时身穿银红色丝绸晚礼服仰卧在镜子正前方的地毯上,头朝镜子,脚朝房门。死者颈部有淤痕,呈手指状分布。喉部下方有轻微抓痕,死亡时间:夜晚十一点半到十二点之间。死者双手置于胸口。右手握着一枚翡翠戒指。 致命伤在胸口正中偏左,拆信刀近乎没入,仅余刀柄在外。刀身与胸骨呈45度角,自下向上、自外向内侧倾斜,但伤口外缘存在轻微扩裂,皮瓣边缘有两处重叠的刺入痕迹。内部创道也呈现两条角度细微偏差的路径:一道较浅,一道更深并直入心脏。 「画室格局」 死者被发现于画室,画室位于苏公馆三楼尽头,是一个约四十平方米的长方形房间。 南墙是一整面落地窗,窗外是公馆后花园。东墙挂着苏曼莎的肖像画,共七幅,由顾云笙在三个月内陆续完成。每幅画的风格和色调都不同。西墙立着那面古董穿衣镜。 房间中央有一张红木书桌,房间没有打斗痕迹。 另外:画室内发现一条暗门,可直接绕回前厅 「那面镜子」 镜框是黄铜所制,雕有藤蔓与花卉纹样,高约一米八,宽约八十厘米。镜子镶嵌在镜框内,背面有木质衬板。镜前铺着一块波斯地毯,地毯上有血渍。 古董穿衣镜的镜面呈蛛网状碎裂,裂纹以镜面中心偏下的一点为圆心向外辐射。圆心位置约在镜中人胸口的高度。 【特别说明】 镜子里的爱人,伸手触碰世俗的厚度。 * 听友群开通啦!(添加微信:wszzyooo 即可~ * 更多阵地:小红书-BingoBingo

103分钟
2k+
1周前

《抗衰大脑》:被低估的逆龄操作,竟然这么简单|64

不束高阁

本期讲一本非常干货,富含小妙招的书!当你觉得自己最近“脑子转得慢了”“记性变差了”“无法多线程工作了”,这可能不是错觉,而是你的大脑在悄悄走下坡路。 一个残酷的科学头相是:从大脑开始衰退,到你出现明显的认知下降,这中间大约有20年的“潜伏期”!因为大脑的代偿能力极强,当你明显感觉到“脑子不够用”的时候,问题往往已经积累了十几年。 本期节目,我们要讲的《抗衰大脑》(今年刚引进的新书,蛮推荐放在家里经常翻阅或者给家人朋友读读),是一本绝对硬核、又极度落地的大脑保养说明书。美国神经科学家马克·米尔斯坦博士用最新的顶尖研究打碎了无数常识: 西兰花吃错了?为什么下锅前多做一步,能让你的抗衰效果翻倍? 大脑下水道?你的大脑每年产生的垃圾居然比它本身还重?怎么清理它? 睡前喝点酒?酒精到底能不能助眠? 微运动奇迹:一个小小改变就能达到控糖又抗衰的神效? 不要觉得抗衰是一件老了才需要做、或者需要极大毅力去改变生活方式的苦差事。 听完这期,做好三件小事,你的大脑就已经开始变年轻了。 -- 【母亲节礼物推荐❤️佰小舒凝露优惠券⬇️】: 【🎁天猫优惠券领取入口】 【🎁京东优惠券领取入口】 【听友专属福利】:点击链接,即可领取不束高阁听友专属优惠券,在评论区晒出你的购买单号,我们还将额外抽取3位幸运听友直接免单~ ---- ❤️你可以通过以下方式联系/关注我们: 🍠小红书(获取过往讲书要点笔记):哈希 📷视频号(分享灵光一闪的启发和读书收获):哈希-不束高阁 🎵抖音:哈希 微博:@一颗哈希 🎧 添加主播加入听友群:haxi_xxx ---- 时间轴 Timeline 00:10 你的西兰花可能白吃了?一本满满都是反直觉干货的大脑说明书 01:05 认知警钟:大脑的代偿掩护能力极强,保护期远比你想象的长(且早) 02:41 牵一发而动全身:大脑衰退,往往伴随着免疫失调和慢性炎症 04:06 破除抗衰三大误区:基因不是判决书,生活方式决定了70%的大脑结局 07:29 不需要翻天覆地的改变:每天10分钟微量行动,当天的记忆力测试就能显著提升! 【支柱一:睡眠】你的大脑下水道,只在晚上开放 09:32 可怕的计算:大脑每年产生的斑块与缠结垃圾,竟然比它自己还重 10:20 睡着后大脑会“缩小65%”?揭秘神奇的“胶质淋巴系统”冲刷机制 13:13 极易被忽视的隐形杀手:未治疗“睡眠呼吸暂停”的人,记忆减退可能早到10年! 13:56 彻底告别睡前饮酒助眠:哪怕只喝一点,也会破坏清理垃圾至关重要的“深睡眠” 15:00 向网球传奇学睡眠:用黑胶带封死卧室所有光源,给褪黑素最好的释放环境 16:55 顺时激活法:早上晒10分钟太阳,其实是在给晚上的褪黑素分泌“倒计时” 【支柱二:运动】不用累到喘,微动就是胜利 20:59 运动不是间接护脑,它是直接分泌大脑“有机肥(BDNF)”的催化剂 22:27 法国百岁老人的启示:运动的复利效益真的可以量化 23:07 为什么“跳舞”可能是对大脑最好的全方位“交叉训练”? 24:47 一举两得的神仙操作:饭后散步15分钟,吃完碳水马上做5个深蹲 25:58 【佰小舒·母亲节好礼推荐】 关爱长辈、家人朋友,呵护健康 【支柱三:饮食】吃对一口菜,大脑年轻三岁 32:07 大脑最怕的物质没有之一:过量的糖,是如何将认知衰退变成“三型糖尿病”的? 33:52 最硬核护脑法:MIND饮食(地中海饮食与DASH饮食的最强抗老结合体) 38:20 敲黑板!99%的人西兰花都做错了!揭秘保留“萝卜硫素”的核心两步骤 【支柱四:社交与心态】对抗慢性损耗的隐形盾牌 40:27 震撼事实:孤独对大脑和身体的伤害,相当于每天抽15根烟 41:34 社恐福音:有效的社交不在多,跟最好的朋友打一通电话也能激活安全感回路 43:37 多看30分钟喜剧:不仅能让你开心,还能真实地降低体内的促炎因子 44:56 “担忧隔离法”:每天只在下午4点集中担忧15分钟,把其他时间还给平静 45:46 被低估的终极护脑手段:“学习新事物”本身就是一种物理层面的垃圾清理行为! 添加主播加入听友群:haxi_xxx “不束高阁”已上线平台:小宇宙、喜马拉雅、苹果播客、微博、荔枝、网易云音乐、豆瓣、spotify 📌 附录:MIND饮食(健脑饮食)速成指南 (被称为目前研究证据最充分的护脑饮食体系,融合了地中海饮食与DASH饮食。严格遵循可降低53%的认知衰退风险,哪怕只是大致跟着吃,也能降低35%的风险) 🟢 应该多吃的10类“护脑食物”: 1. 绿叶蔬菜(菠菜、羽衣甘蓝等):每周至少吃 6 份。 2. 其他蔬菜:每天至少吃 1 份颜色鲜艳的蔬菜。 3. 坚果:每周吃 5 份(强烈推荐核桃,每天 3 颗连续吃有奇效)。 4. 浆果类水果(蓝莓、草莓、树莓等):每周至少吃 2 份。 5. 豆类(红豆、黑豆、扁豆等):每周至少吃 3 份。 6. 全谷物:每天至少吃 3 份(糙米、燕麦、全麦面包)。每餐主食大约一个拳头大小。 7. 鱼类(富含Omega-3,如三文鱼、沙丁鱼、黄花鱼等):每周至少吃2顿。 8. 禽肉(鸡肉、去皮鸭肉):每周至少吃 2 顿(代替红肉)。 9. 特级初榨橄榄油:作为日常烹饪的主要用油。 10. 葡萄酒(可选):如果您有饮酒习惯,每天不超过 1 杯(不喝酒者无需刻意开始)。 🔴 应该严格限制的5类“伤脑食物”: 1. 红肉(猪、牛、羊肉):每周不超过 4 份。 2. 黄油与人造黄油:每天少于 1 汤匙。 3. 精制奶酪/芝士:每周不超过 1 份。 4. 油炸与快餐食品:每周最多吃 1 次。 5. 糕点与甜品(即添加糖和精制碳水):每周少于 5 份,越少越好

51分钟
2k+
1周前

163: 详解DeepSeekV4:Infra巨鲸、百万上下文走进现实、极致效率优化

晚点聊 LateTalk

「走进不同团队的成果,创新从来是连续的,不是跳跃的。」 上周五,DeepSeek V4 发布。我们邀请了两位一线 AI 从业者一起详解 DeepSeek V4 的技术实现和创新想法。 如果一句话概括:DeepSeek V4 并没有带来新的“范式变化”,它是继续在 R1 的“测试时扩展”范式下,用一系列组合创新和工程优化,让百万上下文从理论进入实用。 超长上下文上的稳定表现,正是 Agent 和多步复杂任务亟需的能力之一。 本期涉及的诸多技术术语见 Shownotes 末尾注释。 本期节目的图文版也已经发布:详解 DeepSeek V4:Infra 巨鲸 “四连击”,百万上下文走进现实 本期嘉宾 赵晨阳,RadixArk 工程师,SGLang 开源推理框架开发者 刘益枫,UCLA 博士生 本期主播 程曼祺,晚点科技报道负责人 时间线: 体感、对比、消失的成本、DeepSeek 的节奏 03:01 编程能力与“御三家”有差距;不再采用 DeepSeek 自己提出的 MLA 07:44 不再披露训练成本,“用模型能力说话” 09:23 延期推测:四个耦合的新 feature (新注意力+Muon+mHC+FP4)一起上,难度爆炸 12:36 不是范式创新,沿现有范式仍有巨大提升空间 性能与效率 14:32 提出新的能力方向比刷单个 benchmark 重要 16:41 坦诚的内部评测:9% DeepSeek 工程师不会把V4 Pro 作为编程首选 23:03 单 token 推理的计算量和 KV cache 大幅优化,但解决同样问题的 token 消耗更多了 V4 具体进展 28:32 整体思路:极致的稀疏 33:45 混合稀疏注意力:放弃 MLA,SWA滑动窗口+CSA稀疏压缩+HCA稠密压缩,层间预定义分工 39:37 Muon 优化器已成检验工程能力试金石 48:52 mHC:从 Seed 提出 HC 到 mHC;Kimi 的 Attention Residuals 54:24 Infra 两个关键词:TileLang & FP4 01:10:11 多专家训练+蒸馏的后训练 01:13:20 评测危机:benchmark会过时饱和,evaluation是永恒追求,agent评估未共识 更多讨论 01:19:25 近期模型共性:架构趋同(MOE+Muon),优化方向驱动(agent、coding) 01:25:18 美国追新能力、高定价;中国追性价比、工程极限 01:28:00 V4 最有可能被记住的思想:极致压缩+低激活比+低单token成本,成为后续开源模型起点 剪辑:Nick 相关链接: 158期:V4发布前的DeepSeek:人才竞争、组织特点和独特的AGI目标 143期:再聊 Attention:阿里、Kimi 都在用的 DeltaNet 和线性注意力新改进 104期:我给线性注意力找“金主”,字节 say No,MiniMax say Yes 103期:用Attention串起大模型优化史,详解DeepSeek、Kimi最新注意力机制改进 102期:DeepSeek 启动开源周,大模型开源到底在开什么? 附录:术语、概念解释 - 模型架构相关 Token-wise(词元级)改进:优化模型处理单 token 的过程,通常用于提升注意力计算、上下文建模或推理效率。 Layer-wise 的改进:优化模型不同网络层的结构或计算方式,通常用于提升训练稳定性、表达能力或整体计算效率。 MoE:Mixture of Experts 混合专家网络,让不同“专家”子网络处理不同输入,降低单次计算成本。 哈希路由:把 token、样本或请求分配到不同专家、节点或存储位置的方法。V4 在前几层 MoE 用了哈希路由,避免起始层路由塌缩。 Engram:DeepSeek 之前提出的一种带 N-gram 编码器的辅助模块,通过额外编码连续 token 片段,帮助模型利用局部短语级信息。V4 未使用 Engram。 - 注意力相关 MLA:Multi-head Latent Attention,多头潜在注意力,引入潜在表示压缩 KV 信息的注意力机制,能降低显存占用和计算开销。 MQA:Multi-Query Attention,多查询注意力结构,共享 Key/Value,仅保留多头 Query,提升推理效率并减少 KV cache。 线性注意力:通过核函数或近似方法将注意力复杂度从二次降低为线性(一维),是改进原初注意力随上下文长度增加,计算和显存爆炸的方向之一。 稀疏注意力:仅计算部分 token 间的注意力(而非全连接),改进原初注意力问题的另一主流方向。 滑动窗口注意力:限制注意力仅在局部窗口内计算的一种稀疏注意力。 CSA:Compressed Sparse Attention,压缩稀疏注意力。用于长上下文建模的注意力机制。把序列分组压缩成更少的token,query再从中挑选出最相关的部分。V4中的压缩比是4:1。 HCA:Heavily Compressed Attention,高度压缩注意力。同样用于长上下文建模。相比CSA压缩比例更高(128:1),query无需挑选token。 NSA/DSA:V4发布之前,DeepSeek 在年初和 9 月先后提出的两种稀疏注意力方案。 - 优化器相关 AdamW:一种改进的 Adam 优化器,通过解耦权重衰减(weight decay)提升训练稳定性和泛化能力。 Muon:一种面向大模型训练的优化算法,通过改进梯度更新或内存效率来提升训练性能。 Learning Rate:学习率,控制模型参数每次更新步长的超参数,对训练稳定性和收敛速度至关重要。 牛顿-舒尔茨迭代:一种用于矩阵归一化或求逆的数值迭代方法。Muon 作者 Jordan 提到通常使用 5 次迭代,V4 中采用了 10 次迭代。 - 残差相关 HC:Hidden/Highway Connection,一类改进残差连接的信息通路设计,用于增强信息传递或控制梯度流。 mHC:Manifold-Constrained Hyper-Connections 流形约束超连。DeepSeek 在 HC 基础上的改造,解决了 HC 在大规模训练时的数值不稳定问题。mHC 使用了双随机矩阵,即每行和、每列和都等于 1 的矩阵,以约束信息流。 Attention Residuals:注意力残差连接,将注意力模块输出与输入相加,用于稳定训练并保留原始信息。 - Infra 相关 矩阵乘法:深度学习中最核心的基础计算操作(如向量与权重相乘)。 Kernel:算子核,指在底层硬件(如 GPU)上执行的高效计算函数,是深度学习算子的实现基础。比如矩阵乘法就要写 Kernel 去实现。 CUDA:英伟达开发的能使用 GPU 的一层软件系统,也指一套语言,本次访谈语境里指编写 GPU 算子 kernel 的语言。 Triton:由 OpenAI 开源,是对 CUDA 的一层抽象,能更简单的写 Kernel。 TileLang:一种面向 AI 高性能算子的 tile 级 DSL / 编译框架,把矩阵乘法、注意力等张量计算映射到 GPU 等硬件上执行,在 Triton 的易用性和 CUDA 的控制力之间取得了较好的平衡。 FP8、FP4、INT4:低精度数值格式,分别用 8 位、4 位浮点和 4 位整数表示模型中的权重或中间数据,用于降低显存和带宽压力、提升训练或推理效率。 FP4 比 FP8 更省显存和带宽,又比 INT4 更保留浮点动态范围,因此更适合复杂训练/采样链路,但收益取决于硬件、缩放策略和 kernel 实现。V4 在 1.6T 参数规模上实现 FP4 训练是个不小的挑战。 小红书@曼祺_火柴Q即刻@曼祺_火柴Q ☆《晚点聊 LateTalk》建立「 播客听友群」啦!☆ 欢迎关注科技、商业大公司动态和创业创新的小伙伴进群交流,第一时间收听新节目。 这里有更多互动,更多话题讨论。欢迎贡献选题 & 推荐嘉宾。 请先添加「晚点」小助手的微信号,备注:“晚点聊”,我们邀请您入群。 关注公众号《晚点 LatePost》和《晚点对话》,阅读更多商业、科技文章:

93分钟
22k+
1周前

189 我们给的 都是自己想要的

扒虾

本期卡司: 木头丨略显“狡猾”的引导式玩伴/同事/恋人 翻翻丨即使没出场也一直在话题中心的嘉宾候选人 大七丨情绪反复横跳、愤怒又自省的妈妈 本期音楽: OP: KOOW - 증거 있습니까! ED: 黄丽玲 - 《逃避没有不好》 插曲: Goodkill Music - Overcooked! (Penne For Your Thoughts Gameplay Version) 第九艺术独一无二,获得的成就感也是。木头和小七在游戏中演绎“佛系带飞”,一位母亲却差点因一句话让自己“人设”不保。一场关于“引导和控制”的教育话题就此展开。从家庭成员的角色定位出发,大七道出了在儿童教育过程中的困惑与无奈;反观自身时,又对“兜底”和“托举”表达了自己的感受,想躺平和逃避的心情也到达了极致。 而在给予正激励方面已颇有建树的木头老师一边生动叙述“跳楼机式教育”的具体操作方法并切身实践,一边为大七的“严肃/快乐教育”疯狂支招,不仅讲出了埋藏在心底已久的想法,甚至(不小心?)还透露出了背着女朋友做出的那件事情,惹得大七大为光火,扬言要立马告发此人。急需大家收听本期内容,在评论区留下你们的想法,如果是你,你会怎么做? 如果你对本期或往期话题感兴趣,欢迎随时在评论区留言与我们激情讨论,同时也欢迎投稿以及申请入群。投稿邮箱:[email protected]

57分钟
99+
1周前

E257 珍惜每一段时间的因缘

炑星迹

昨天原本已经打算睡觉了,Rio 突然邀请我一起录这期播客。 分享我们最近做音乐专辑的一些想法和灵感,遇见「莲花声小姐姐」的故事。 播客里面,她还剧透了一些歌词和编曲的「小巧思」。 常常赞叹 Rio 对于文字的理解和表达,好像并没有文字或者是 Rio 之间的分别。 他们彼此之间是那么融合、自然、顺应。 感恩 Sindy 、Lulu、海边木屋蜜糖棕收藏家 支持我们创作更多的音乐:) 感恩大家的喜爱和聆听 感恩一切 祝福大家 :) Cen 2026.04.30 —— 🕙 时间戳: * 00:04 音乐片段:Namo Avalokiteshvara * 00:49 莲花声小姐姐的故事 * 04:35 祈请文的缘起和来源 * 05:38 音乐:莲花生大士祈请文 * 09:38 金刚像太阳一样温暖 * 09:56 音乐片段:Vajra Silence * 11:23 自然的流露以及这期播客的缘起 * 13:49 《人间》专辑封面的设计灵感 * 16:44 这些作品中的 DNA * 17:33 《烦恼》设计过程中的小细节 * 18:32 音乐:烦恼 * 21:16 《六道》唱完了一整期播客 * 25:11 音乐片段:六道 * 27:44 《六道》里面的小彩蛋 * 29:12 庆幸在修行的基础上创作 * 29:44 理解哲学的出口 * 30:46 音乐片段:维特根斯坦的边界 * 33:30 哲学感的音乐是什么样的? * 37:24 《人慈》选择看见完整的世界 * 41:09 以更成熟的视角看待这些现象 * 42:54 音乐:人慈 * 48:21 做积极的大多数 * 50:20 音乐里看见的场景 * 52:06 音乐片段:普贤 · Act Without Trace * 53:24 《寻声》专辑封面的设计灵感 * 54:51 音乐片段:文殊 · No Mind * 56:56 音乐片段:地藏 · Until All Are Free * 59:02 力所能及地去做 * 1:01:47 这个世界不缺好的音乐 * 1:02:37 我们表达的发心和核心 * 1:05:02 莲花声小姐姐也是炑星迹的陪伴 * 1:05:48 《如来觉》专辑的创作来源 * 1:09:58 音乐片段:空花未开 * 1:12:55 直接而又力量的表达 * 1:14:14 音乐片段:无尽藏 * 1:16:00 只是音乐借我们经过 * 1:17:39 珍惜每一段时间的因缘 * 1:19:54 没有概念性过滤的体验 * 1:22:32 《慈经》创作的初心 * 1:24:10 祝福和感恩大家 * 1:24:28 结尾音乐:慈经 * 感恩封面:专辑《观音》封面 —— 🙏 感恩大家一路同行,祝愿大家天天平常。

87分钟
1k+
1周前

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧