OpenAI突破神经网络可解释性,SIMA 2发布,百度推出文心5.0,阿里开创自进化智能体系统|奇绩前沿信号1117

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:11 OpenAI提出权重稀疏化训练范式:神经网络电路可解释性获得突破性进展 01:41 DeepMind 的 SIMA 2:结合推理与自我进化的 3D 虚拟-环境智能体 02:33 百度发布文心5.0:原生全模态统一架构突破多模态理解与生成边界 03:27 阿里巴巴通义实验室发布AgentEvolver:首个自进化智能体系统,实现自主任务生成和经验驱动学习 04:28 Salesforce AI 提出 Socratic Self-Refine (SSR):通过苏格拉底式步骤分解实现大语言模型推理的精细化验证与迭代优化 05:16 NVIDIA和MIT提出ParoQuant:通过成对旋转量化实现高效推理LLM推理,在推理任务上平均提升2.4%准确率且开销不足10% 06:08 西安交通大学等提出SPAttention:通过结构化稀疏注意力机制实现训练效率翻倍且性能提升 06:53 南京大学提出Split-Layer架构:通过最大化特征空间维度,显著提升隐式神经表征能力 07:39 南洋理工大学与香港科技大学提出OmniVGGT:全模态驱动的视觉几何基础Transformer,实现任意辅助输入的3D重建新范式 08:20 中山大学等提出TubeRMC框架,通过管道条件重建实现弱监督时空视频定位,在VidSTG和HCSTVG数据集上超越现有最佳方法 09:13 哈尔滨工业大学提出SemanticVLA:通过语义对齐的稀疏化与增强,实现高效机器人操作,在LIBERO基准上超越OpenVLA达21.1%成功率,同时训练成本和推理延迟分别降低3.0倍和2.7倍 10:02 华东师范大学等提出Audio-VLA:首个融合接触音频感知的视觉-语言-动作模型,突破机器人操作的视觉感知瓶颈 10:54 埃默里大学与加州大学洛杉矶分校提出SE-Diff:融合生理仿真器与临床经验的心电图生成模型,实现从文本到12导联ECG的高保真合成 11:43 Salesforce AI Research发现Agent对话中的身份失效现象,在多轮对话中Agent会抛弃原有角色并模仿对话伙伴 12:34 Meta等提出多头解码推荐框架,通过结构化人类先验知识显著提升推荐系统准确性与多样性 13:16 腾讯发布GPR:首个端到端生成式广告推荐系统,在微信视频号实现GMV和CTCVR显著提升 14:01 清华大学等机构提出SACRED-Bench:揭示大型语音模型在语音-音频复合攻击下的安全漏洞,攻击成功率高达66% 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
1个月前

【模型体验特刊】Kimi 、Minimax对比GPT、Gemini、Claude等|奇绩前沿信号1115

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

11分钟
99+
1个月前

GPT-5.1发布,自监督学习框架突破,AI数据中心建设加速,李飞飞世界模型新进展|奇绩前沿信号1114

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:11 OpenAI 推出 GPT-5.1:更聪明也更“有人味” 01:12 布朗大学与纽约大学提出LeJEPA:首个无启发式的可证明自监督学习框架,实现理论最优与实践简洁的统一 03:21 Anthropic宣布500亿美元AI数据中心建设计划,加速美国基础设施布局 04:37 Meta在威斯康星州启动第30座AI数据中心建设——兼顾算力扩展、社区共建与生态修复 05:39 李飞飞World Labs发布Marble多模态世界模型 07:28 英伟达发布SONIC:100万帧数据训练的人形机器人通用运动控制系统,实现跨模态统一控制 08:18 清华大学与复旦大学等机构发布JustRL:以极简强化学习配方,实现小模型性能超越同类SOTA 09:06 MIT与Transluce联合发布:训练语言模型解释自身计算过程,揭示"特权访问假说"的有效性 09:44 斯坦福大学提出Feedback Descent:通过成对比较实现开放式文本优化,在分子发现中超越99.9%基准 10:24 Salesforce AI研究院提出GeoGNN:通过测地线聚合消除文本图神经网络中的语义漂移,在多个基准上实现显著性能提升 11:03 英伟达提出TiDAR:首个在保持自回归模型质量的同时实现4.71-5.91倍吞吐量提升的混合架构 11:39 小红书与上海交大提出LoopTool:通过模型感知的闭环数据演化,让8B模型在工具调用上超越32B生成器 12:20 ElevenLabs发布Scribe v2 Realtime,以150毫秒刷新语音识别速度纪录 12:43 Google DeepMind发布像素级自回归建模的缩放定律研究,预测五年内可实现原生分辨率图像生成 13:13 卡内基梅隆大学与Skild AI提出ViPRA:通过视频预测学习机器人动作,仅需百余演示即可实现高频连续控制 13:34 加州大学伯克利分校和普林斯顿大学提出多步拟度量学习(MQE),在最长4000步的长视野任务和真实机器人操作中实现了目标到达的组合泛化 13:56 Meta联合卡内基梅隆大学发布SPIDER:大规模物理感知灵巧重定向技术,实现人类动作向机器人的高效转换 14:16 卡内基梅隆大学提出IFG:融合视觉语言模型与力闭合模拟,实现互联网规模的功能性灵巧抓取生成 14:37 卡内基梅隆大学等发布视觉世界模拟路线图,构建从视频生成到世界模型的四代演进框架 14:59 CellWhisperer将转录组与文本的多模态学习用于交互式单细胞 RNA-seq 数据探索 15:22 教会语言模型用工具推理:中国科大与阿里巴巴Qwen团队提出CoRT框架,显著提升数学推理效率 15:43 字节跳动发布Lumine:首个实时完成3D开放世界游戏数小时任务的通用智能体 16:07 浙江大学与蚂蚁集团发布ProBench:基于精确过程信息的GUI智能体评测基准,揭示现有智能体在真实场景中的重大局限性 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

16分钟
99+
1个月前

Meta多语言语音识别,李飞飞世界模型新观点,斯坦福科学发现环境,小红书RedOne2.0发布|奇绩前沿信号1113

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:12 Omnilingual ASR:开放源代码的多语言语音识别系统支持1600多种语言 01:39 李飞飞最新发文谈World Labs 世界模型:提出可生成、交互与多模态一致性的空间智能路径与长期产业机会 02:46 斯坦福大学和Dualverse AI发布Station:首个开放世界AI科学发现环境,在多项基准测试中创下新纪录 03:37 小红书推出RedOne 2.0:用渐进式强化学习重塑社交网络领域大模型训练范式,4B模型性能超越7B基线2.41分 04:43 微博AI发布VibeThinker-1.5B:仅15亿参数的小模型在数学推理上超越6710亿参数的DeepSeek R1 05:26 新加坡国立大学提出SofT-GRPO算法,首次实现软思维推理模式超越离散Token强化学习 06:12 Meta AI与德州大学奥斯汀分校揭示:强化学习在非主方向上学习,首次破解RLVR参数演化之谜 06:58 百度开源ERNIE-4.5-VL-28B-Thinking:以3B激活参数重塑多模态推理格局 07:35 Mila和McGill大学发布GroundCUA数据集和GroundNext模型,在桌面环境下实现了最先进的UI元素定位性能 08:24 宾夕法尼亚大学提出DIMO:首个从单张图像生成任意物体多样化3D运动的生成模型 09:06 清华大学与微软亚洲研究院提出以真实人类活动视频为基础的可扩展视觉-语言-动作预训练框架,显著提升机器人操控的泛化能力 09:42 谷歌DeepMind提出PhysWorld:让AI从生成视频中学会真实世界的物理操作 10:36 基于“幻觉驱动”的蛋白设计——面向前向推理的 AlphaFold3 结构生成与功能设计 11:20 马克斯·普朗克软件系统研究所与微软提出LoRA on the Go,实现无需训练的实例级LoRA动态选择与合并 11:58 KAIST和亚马逊提出MARA多智能体对话系统,通过动态协作显著提升个性化对话质量 12:28 波恩大学与拉马尔研究所发现:多智能体协作虽能提升数学推理准确率,但对抗鲁棒性差距依然存在 13:10 字节跳动与北京大学联合推出LPFQA基准:从专业论坛提取长尾知识,构建真实复杂推理评测体系 13:52 Yann LeCun拟离职Meta创业,开源AI领军力量或将转向新赛道 14:35 软银清仓英伟达58亿美元股份,聚焦OpenAI及AI基础设施投资 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
1个月前

影石Insta360刘靖康x奇绩合伙人毛圣博:从校园宿舍到全球品牌,复盘创业早期的思考与实践

奇绩创坛

成功的创业故事常从结果讲起,但决定方向的关键时刻,往往藏在最初的起点。 对早期技术创业者来说,那是一个问题尚未被准确定义、路径仍在摸索的阶段。刘靖康也曾在这样的起点上。 在与奇绩创坛合伙人毛圣博(Peter)的深度对谈中,作为全球领先智能影像品牌影石Insta360 创始人兼董事长,刘靖康难得地回顾了影石创新(Insta360)从 0 到 1 的完整历程。 本期节目我们将回顾靖康与Peter的对话内容,希望能够启发还在探索中的你。 【嘉宾介绍】 刘靖康:智能影像科技品牌-影石创新(Insta360)创始人,毕业于南京大学软件学院,带领企业打破海外品牌垄断,推动公司全景相机全球市场份额连续 6 年稳居第一。 毛圣博:奇绩创坛合伙人,毕业于哈佛大学,前熊猫资本创始合伙人,投资过旷世、Insta360、摩拜、七牛云等独角兽。 【关于影石创新(Insta360)】 影石创新(Insta360)成立于2015年,是全球知名智能影像品牌,致力于帮助人们更好地记录和分享生活。目前全球硬件用户已达数百万,遍布 200 多个国家和地区,曾三度入选中国全球化品牌50强。作为国家级专精特新重点“小巨人”企业,其全景相机全球市占率连续 6 年第一。2025年6月,影石正式登陆上海证券交易所科创板。 【内容详情】 本期访谈稿件已于奇绩创坛公众号发布,欢迎关注获取更多内容更新。如果你对本期话题感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。 【时间轴】 01:42 毕业即创业,早期创业方向的探索 04:54 从ToB 到 ToC,什么契机意识到需要转型? 06:47 早期创业,到底该“以终为始”,还是“边走边试”? 08:54 软件团队做硬件的 learning curve? 10:13 早期创业者需关注的两大供应链风险和应对措施 11:54 从学校起步到扩张至百人、千人团队,如何完成创业者的“自我修养”? 13:14 创业到什么时候,需要开始系统性考虑管理问题? 18:22 做世界一流的影像品牌,标杆和一流的区别是,前者需要动态地、不断地创新 19:17 如何找到和招到真正有创业激情的创业同伴? 20:49 3000 多人、600 多种岗位,影石怎么做员工发展策略? 22:11 如何保持“Always Day One”的状态,实现公司的可持续增长? 24:50 除了勇敢,创业者需要具备哪些稀缺的品质? 27:06 中国供应链的崛起与创业者入局时机的判断 30:57 如何成长为全球化公司:从销售结果全球化、 销售全球化到人才全球化与品牌心智全球化 32:51 打造世界级标杆消费电子公司:要持续找到银色子弹的机会,现在手里有 4 颗 35:34 作为运动相机公司的 CEO,如果不运动怎么做好产品? 37:38 给年轻创业者的建议 人才价值不是叠加而是乘数关系:1 克拉的钻石市场价是1 万美金,10 克拉钻石市场价是 100 万美金 要对长期更有信心,降低短期的成功预期:只要没下牌桌,下一局都会有 reward

40分钟
99+
1个月前

谷歌新一代TPU,阶跃星辰开源音频模型,阿里人大智能体突破,华东师大与创智音乐绘画评估|奇绩前沿信号1112

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:11 谷歌发布第七代TPU Ironwood:自建AI基础设施体系成型 02:27 阶跃星辰首个开源LLM级音频编辑大模型 Step-Audio-EditX,实现情感语调一键控制 03:52 阿里巴巴通义实验室与中国人民大学联合提出IterResearch:通过马尔可夫状态重构实现长视野智能体的突破,在六大基准测试中平均提升14.5个百分点 05:06 华东师范大学与上海创智学院提出MPJudge:首个基于人类感知的音乐绘画一致性评估框架,准确率达93% 06:08 谷歌研究院提出TNT训练范式:通过分层记忆和两阶段训练,将深度记忆模块训练速度提升17倍 07:05 华盛顿大学与艾伦人工智能研究所提出RLVE:通过自适应可验证环境实现语言模型强化学习的规模化突破 07:38 苏黎世联邦理工学院等提出UHead:通过不确定性头实现高效的大语言模型推理步骤验证 08:00 腾讯混元团队发布DRIVE训练框架,在32B参数规模下实现竞技编程代码生成的突破性进展 08:22 加州大学伯克利分校等机构提出StreamDiffusionV2:首个满足实时服务级别目标的视频扩散流式生成系统,在4张H100 GPU上实现58.28 FPS(14B模型)和64.52 FPS(1.3B模型) 08:54 英伟达等提出Long Grounded Thoughts:构建百万级视觉推理数据集,7B模型性能超越闭源系统 09:22 卡内基梅隆大学与上海交通大学提出BSCodec:通过频段分离实现高质量通用音频重建,在相同训练条件下以一半码率达到DAC基线的性能 09:49 加州大学伯克利分校提出Lightning Grasp,实现毫秒级灵巧抓取合成,速度提升数百倍 10:13 南洋理工等机构发布VLA模型发展路线图,提出十大核心挑战指引具身AI未来突破 10:32 耶鲁医学院发布最大规模医学RAG系统专家评估,揭示检索增强生成技术在医疗领域的关键局限性 10:56 上海交大提出在部分缓存一致性CXL共享内存上构建索引的SP与P³指导原则,实现高达19倍性能提升 11:14 微软等机构提出SynthAgent:通过双重精炼的合成监督,使Web智能体无需人工标注即可适应新环境 11:32 RAND和英国AI治理中心发布通用人工智能事件报告系统设计框架,为AI治理提供制度设计指南 11:51 Meta发布DigiData:构建首个深度移动控制智能体训练数据集,实现复杂移动设备自动操作 12:06 快手Kling团队与南京大学等机构联合发布MVU-Eval:首个多视频理解评估基准,揭示多模态大模型在跨视频推理中的显著局限 12:28 佐治亚理工学院提出OckBench基准测试,首次建立大模型推理效率评估标准 12:48 微软研究院提出GrinningFace基准:揭示视觉-语言-动作模型如何有效继承视觉-语言模型的先验知识 13:08 英特尔CTO Sachin Katti加盟OpenAI,聚焦算力基础设施建设 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

13分钟
99+
1个月前

本周 AI 前沿一览:工具使用解锁模型“无限”能力,单卡实时生成可交互3D世界|奇绩前沿信号【一周特刊】10.25

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:18 苹果公司研究团队发现状态空间模型通过工具使用实现无限长度泛化能力 01:13 复旦大学提出BAPO算法:通过自适应裁剪平衡策略优化,稳定大语言模型离线强化学习训练 02:15 Meta SAM 3:让分割模型从“看见”走向“理解”,开启视觉语义智能新时代 03:08 DeepSeek推出OCR新模型:以视觉压缩文本,革新大模型算力 & 清华大学与智谱AI提出Glyph:通过视觉文本压缩将长文本渲染为图像,在保持性能的同时实现3-4倍上下文压缩和4倍推理加速 04:22 李飞飞团队提出MoMaGen:通过约束优化生成双臂移动机器人多步操作演示数据,实现单个演示扩展至千倍数据集 05:16 GigaAI发布GigaBrain-0:世界模型驱动的视觉-语言-动作模型,开创机器人训练新范式 06:07 李飞飞团队发布 RTFM:单卡实时生成可交互 3D 世界,重塑“世界模型”范式 06:53 腾讯开源 Hunyuan World 1.1:单步生成任意输入的3D世界模型,或将加速具身智能与虚拟场景构建 07:22 上海AI Lab与创智学院发布UniMedVL:医学多模态理解与生成统一模型,在五项医学理解基准和8种医学成像模态上均逼近专用模型性能 08:16 Anthropic发布Claude生命科学版,强化AI在科研全流程中的辅助能力 08:56 英伟达与台积电在美国量产首片Blackwell AI芯片晶圆 — 标志美国本土先进制程制造能力初步落地 09:42 Anthropic发布Claude Agent Skills:从Claude Skills看AI系统的新范式 10:21 快手推出KAT-Coder:通过四阶段训练体系,将代码模型从静态生成器进化为可部署的智能编程代理 11:07 阿里通义千问团队发布Qwen3Guard,实现三级安全分类和实时流式检测的多语言AI安全防护模型 11:50 OpenAI 进军浏览器市场,推出 ChatGPT 浏览器——ChatGPT Atlas 12:34 Karpathy判定“这是Agent的十年”:AGI仍需约十年、路径更偏工程化与渐进式 13:36 马斯克宣布X平台将用Grok全面替代启发式推荐算法,引发关于内容分发公平性与“人类感”的广泛讨论 14:19 Meta AI部门裁员600人,战略重心转向前沿模型研发 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
1个月前

Nano Banana 2预览,谢赛宁团队CLM系统,智能体自适应突破,机器人迎GEN-0时代|奇绩前沿信号1111

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:11 谷歌Nano Banana 2预览:以十秒生成4K图像与逻辑绘制,跨越创作与计算边界 01:15 纽约大学谢赛宁团队提出CLM系统:突破GPU显存限制,单卡训练1亿高斯的3D场景重建 02:32 滑铁卢大学与Salesforce AI提出GROUNDED TEST-TIME ADAPTATION:让大语言模型智能体在新环境中快速适应,实现更强泛化能力 03:28 Generalist AI 推出“GEN-0”躯体基础模型 — 具备大规模物理交互训练能力,可能重塑机器人智能提升路径 04:35 字节跳动等提出视觉空间微调(VST)框架,让视觉语言模型像人一样理解3D空间 05:30 小红书发布DeepEyesV2:首个集成代码执行与网络搜索的主动多模态模型,在复杂推理任务中显著超越现有方案 06:20 马里兰大学与杜比实验室提出VisAlign方法,通过优化文本嵌入显著降低大型视觉-语言模型幻觉现象 07:04 英伟达发布Isaac Lab:支持多模态机器人学习的GPU加速仿真框架 07:46 南京大学等提出Pressure2Motion:通过地面压力与文本引导合成高保真人体运动,开创隐私保护型动作捕捉新范式 08:35 牛津大学提出SigmaDock:基于SE(3)扩散的分子对接方法,首次在化学合理性评估中超越传统物理方法 09:26 埃默里大学等提出CNODE框架:用连续时间神经常微分方程捕捉帕金森病异质性进展轨迹 10:15 信道知识地图构建综述:清华、中科大、东南大学等联合发布从插值到无线辐射场的技术演进路线 11:07 斯坦福大学提出实时推理智能体框架AgileThinker,在动态环境下同时实现深度规划与快速反应 12:01 谷歌在新版 Google Finance 推出 Deep Search 并接入预测市场数据 —— 可能提高普通用户与专业研究者对分散信息的整合与前瞻判断能力 12:56 清华大学发布AgentExpt:基于LLM的AI实验设计自动化框架,实现基线和数据集智能推荐 13:44 快手与南京大学发布SWE-Compass:首个统一评估代码智能体的多维基准,覆盖8类任务、10种编程语言,揭示AI软件工程能力的真实边界 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

14分钟
99+
1个月前

三大团队视频感知突破,谢赛宁团队空间推理创新,科学AI计划启动,邱锡鹏团队RL与视频推理创新|奇绩前沿信号1110

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:12 纽约大学Yann LeCun,谢赛宁团队与斯坦福大学Li Fei-Fei团队联合发布Cambrian-S:提出视频空间超感知新范式,在空间认知任务上实现30%绝对性能提升 00:56 纽约大学谢赛宁团队等提出SIMS-V框架:用仅2.5万模拟样本训练的7B模型,在空间推理任务上超越72B基线并逼近大型专有模型 01:34 OpenAI启动“AI for Science”计划以加速科研进程并推动政策协同 02:11 复旦大学、创智学院邱锡鹏OpenMOSS团队与M-A-P提出RLoop框架:通过迭代策略初始化让强化学习实现自我改进,数学推理准确率提升9% 03:02 复旦、创智学院邱锡鹏OpenMOSS团队提出Thinking with Video范式:视频生成作为统一多模态推理的新路径 04:01 斯坦福大学提出因果干预表征发散问题及反事实潜在损失解决方案,提升神经网络可解释性方法的可靠性 04:40 哥伦比亚大学证明布尔函数单调性测试需要近 n^(1/2) 次查询,几乎达到最优下界 05:13 xAI升级Grok 4 Fast:200万token上下文开启“整本书级”推理时代 05:38 纽约大学提出"在测试集上训练"诊断框架,系统揭露多模态基准中可被利用的非视觉捷径,并创建去偏版本基准 06:18 英伟达发布Nemotron Nano V2 VL:12B参数多模态模型,在文档理解和长视频推理上实现显著突破 06:53 南京大学与腾讯混元提出UniAVGen:通过非对称跨模态交互实现统一的音视频生成 07:33 xAI升级Grok Imagine:图生逼真至真假难辨 08:02 清华大学等提出视觉驱动的人形机器人反应式足球技能学习框架,在RoboCup 2025和世界人形机器人运动会中夺冠 08:43 多所世界名校联合发布论文,提出前馈式3D重建综述:加速从像素到世界的生成范式 09:19 从零生成原子级精度抗体:RFdiffusion实现去 novo 抗体设计的实验验证 10:04 中国太空计算星座已运行半年,全球算力基础设施竞争延伸至近地轨道 10:36 斯坦福大学与NVIDIA等机构联合提出:AI时代存储层级重构,将DRAM-闪存缓存阈值从分钟级压缩至秒级 11:15 Meta等机构提出DreamGym:首个通过合成经验数据实现大规模智能体强化学习的统一框架 11:55 微软等发布GUI-360°:首个120万步大规模桌面智能体数据集,在三大核心任务上实现统一评估 12:35 Sandbar发布“会听耳语”的AI智能戒指Stream Ring,内置聊天机器人,支持语音转写 13:03 华为诺亚研究院提出E-CARE框架:用单次LLM推理实现高效常识增强推荐,搜索精度提升12.1% 13:46 卡内基梅隆大学与加州大学伯克利分校发布EDIT-Bench,首个基于真实开发场景的代码编辑能力评测基准,涵盖545个问题,揭示顶尖模型仅60%通过率 14:27 AI2050公布2025年度28位研究员名单,聚焦AI安全、科学智能与可信系统 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
1个月前

本周 AI 前沿一览:AI功能性内省能力,多模态与推理能力迎新里程碑|奇绩前沿信号【一周特刊】11.8

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:34 Anthropic通过概念注入法证明LLM具备功能性内省能力 01:21 上海交通大学,创智学院刘鹏飞团队等机构提出上下文工程2.0:从人机交互到人机协同的二十年演进,构建通往超人智能的上下文认知框架 02:06 Sea AI Lab与新加坡国立大学发现FP16精度可根本性解决大语言模型强化学习训练中的训练-推理不匹配问题,实现更稳定、更快速的模型优化 02:53 复旦大学与创智学院邱锡鹏团队提出MARAG-R1:通过强化学习实现多工具协同的检索增强生成框架,在全局推理任务上达到新SOTA 03:34 复旦大学与创智学院邱锡鹏团队提出Zero-RAG:通过消除冗余知识将检索语料库缩减30%,检索速度提升22% 04:16 清华大学提出Diffuse Thinking框架:用扩散语言模型高效提出推理思路,实现计算效率与推理准确性双重提升 04:47 Hugging Face 发布《Smol训练手册》:揭秘构建世界级小型语言模型的完整方法论,SmolLM3以3B参数实现多语言推理突破 05:27 新加坡国立大学与奇绩智峰等发布扩散语言模型研究:在数据受限场景下实现超越自回归模型3倍以上的数据利用效率 05:54 北京智源研究院发布“悟界·Emu3.5”,首次实现从语言预测到世界状态预测的跨越 06:26 美团发布LongCat-Flash-Omni:首个开源5600亿参数全模态实时交互模型,实现毫秒级音视频响应 06:57 昆仑万维发布SkyReels全新V3平台,开启AI多模态视频创作“零门槛时代” 07:33 Agent-Omni:亚马逊等机构提出测试时多模态推理框架,通过模型协同实现"理解一切" 08:13 小鹏汽车的全新一代机器人IRON 亮相 AI Day,具有类似人类的脊柱、仿生肌肉和覆盖全身的柔软感官皮肤 08:43 OpenAI与AWS达成380亿美元算力合作 — 多云战略加速AI基础设施格局重构 09:15 谷歌启动Project Suncatcher:探索基于太空的可扩展AI基础设施对算力与能源范式的潜在影响 09:44 OpenAI发布Aardvark:让AI成为自动化安全研究员的新纪元 10:14 上海交大与创智学院刘鹏飞团队发布APOLLO:通过异步人机协作训练,让AI智能体在长期复杂任务中表现提升50%以上 10:45 Anthropic提出带批判性压力的代码执行方法(MCP),赋予AI自我调试与修正的能力 11:22 谷歌DeepMind整合AI模型以绘制、模拟和理解自然,旨在提升全球生态保护决策的规模与效率 11:58 复旦大学与创智学院邱锡鹏团队提出GlobalQA基准和GlobalRAG框架,首次系统性解决大规模语料库级推理问题,在全局检索增强生成任务上实现F1分数从1.51提升至6.63的突破 12:37 上海交大与创智学院刘鹏飞团队发布InnovatorBench,构建首个端到端AI研究Agent评估基准,支持36小时长时程创新任务 13:09 复旦大学与上海创智学院等提出UniREditBench:首个统一推理驱动的图像编辑基准,覆盖真实与游戏世界场景,达成多模态双参考评估 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

14分钟
99+
1个月前

新国立与奇绩智峰扩散模型,小鹏机器人,Anthropic批判性MCP,谷歌AI助力生态保护|奇绩前沿信号11.7

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:12 新加坡国立大学与奇绩智峰等发布扩散语言模型研究:在数据受限场景下实现超越自回归模型3倍以上的数据利用效率 01:24 小鹏汽车的全新一代机器人IRON 亮相 AI Day,具有类似人类的脊柱、仿生肌肉和覆盖全身的柔软感官皮肤 02:26 Anthropic提出带批判性压力的代码执行方法(MCP),赋予AI自我调试与修正的能力 03:26 谷歌DeepMind整合AI模型以绘制、模拟和理解自然,旨在提升全球生态保护决策的规模与效率 04:21 爱丁堡大学与伦敦大学学院提出“下一词知识追踪”:用大语言模型解码学生学习行为 05:11 上海交大等提出TASU:仅用文本数据实现语音理解的跨模态对齐突破 06:07 浙江大学等提出OneOcc:首个面向足式机器人的全景语义占据预测框架,在真实四足数据集上超越激光雷达基线 07:03 Generalist AI 发布 GEN-0:在海量真实物理交互上构建可随规模化提升的具身基础模型,可能影响机器人训练的数据与算力分配策略 07:57 AI科学家Kosmos实现多领域科学发现自主复现与拓展 — 自动化科研系统迈出关键一步 08:50 陶哲轩推动AI辅助形式化证明,重构数学研究协作范式 09:42 加州大学伯克利分校提出DADO算法:利用离散函数可分解性实现高效科学设计优化 10:34 中国科学院提出 MemSearcher:通过端到端强化学习让大模型学会推理、搜索与记忆管理 11:23 卡内基梅隆大学提出从交互质量看AI智能体的真正价值 12:15 财智科技发布专有安全响应框架,实现大模型输入输出双层防护与99.3%风险召回率 13:04 伊利诺伊大学香槟分校发布LiveTradeBench,首个基于实时数据流的多市场大语言模型交易能力评估基准 14:02 字节跳动和南京大学发布MME-CC:首个视觉认知能力多模态评估基准,揭示现有模型在空间几何推理上的重大缺陷 14:46 何恺明MIT团队新增两位华人成员,聚焦AI for Science方向 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
1个月前

昆仑万维零门槛视频创作,谷歌启动太空AI探索计划,复旦与创智高效检索框架,亚马逊多模态推理框架|奇绩前沿信号11.6

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:10 昆仑万维发布SkyReels全新V3平台,开启AI多模态视频创作“零门槛时代” 00:59 谷歌启动Project Suncatcher:探索基于太空的可扩展AI基础设施对算力与能源范式的潜在影响 01:43 复旦大学与创智学院邱锡鹏团队提出Zero-RAG:通过消除冗余知识将检索语料库缩减30%,检索速度提升22% 02:23 Agent-Omni:亚马逊等机构提出测试时多模态推理框架,通过模型协同实现"理解一切" 03:03 剑桥大学等机构发布开放角色训练技术,首次实现AI助手人格深度塑造 03:34 加州大学伯克利分校等提出RLAC:用对抗性评判者强化学习,在开放式生成任务中实现高效验证与性能突破 04:06 清华大学等机构提出Deep Ideation框架,基于科学概念网络的LLM Agent生成创新研究想法,整体质量提升10.67% 04:46 清华大学等发布通用听觉智能综述:大型多模态模型在机器听说理解中的全面进展 05:17 清华大学与剑桥大学提出音频水印复用技术,通过多水印互补性显著提升对神经网络重建攻击的鲁棒性 05:54 斯坦福与亚马逊联合推出TWIST2:一套便携式全身人形机器人数据采集系统,15分钟内完成100次成功演示 06:26 加州大学圣地亚哥分校等提出跨实体世界模型,实现不同机器人手间的灵巧操作技能迁移 06:56 北京人形机器人创新中心提出XR-1:基于统一视觉-运动表征学习的通用机器人控制模型,在六种机器人平台上实现突破性性能 07:28 ProDVa模型引入天然蛋白质功能片段构建动态词表生成设计新范式 07:58 Together AI等提出OEA:无需重训练的批次感知专家路由,解码延迟降低39% 08:27 加州大学伯克利分校发布Continuum:基于KV缓存TTL机制的多轮智能体调度系统,显著提升Agent工作负载的完成效率 08:57 苹果与伊利诺伊大学提出CORL:用强化学习实现多智能体LLM系统的性能与成本双重控制 09:15 微软、华盛顿大学等提出Simia框架,实现无需真实环境的大语言模型智能体训练 09:52 字节跳动等机构发布MIRA基准测试,揭示多模态大模型在视觉推理中的根本缺陷 10:24 腾讯优图团队提出LTD-Bench:让大语言模型画图以揭示空间推理盲区,首次实现从抽象评分到直观视觉评估的范式转变 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

11分钟
99+
1个月前
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧