奇绩创坛 - LeCun开源自修代码模型,谷歌Veo 3展现零样本学习|奇绩前沿信号0926 - EarsOnMe

主播

节目简介

来源：小宇宙

我们将这些内容以 AI 与生成播客的形式分享，用通俗易懂的方式呈现复杂技术，帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。

播客每日分享内容由奇绩行研实习生与 AI 共创，播客语音由 OpenMOSS （奇绩 2025 年春季创业营校友企业模型）支持。

针对每日前沿信号内容，我们还准备了进阶版的解读，提供更系统、深入的分析，涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。

点击下方链接获取完整版内容，也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群，一起追踪 AI 最前沿的信息。

【奇绩前沿信号介绍】

【时间轴】

00:10 LeCun团队开源CWM：模型可执行并自修代码

01:39 谷歌DeepMind发布Veo 3：视频模型展现零样本学习与推理能力，向通用视觉基础模型迈进

02:38 复旦大学、创智、上海AI实验室等提出SIM-CoT：通过步骤级监督解决隐式推理的稳定性问题，实现高效精准推理

03:34 阿里发布通义万相2.5，率先实现音画同步视频生成

04:13 宾夕法尼亚大学发布PhysCtrl，实现基于物理参数控制的视频生成技术突破

05:04 可灵AI 推出 2.5 Turbo 模型，开启视频创作新纪元

05:47 谷歌发布EmbeddingGemma：300M参数实现大模型级文本嵌入性能，超越500M以下所有开源模型

06:33 上海交通大学和腾讯混元发布ProsodyEval数据集和DS-WED指标，首次实现零样本语音合成中韵律多样性的准确评估

07:13 阿里巴巴发布Logics-Parsing：通过强化学习实现版面感知的端到端文档解析突破

08:00 Skild AI 大脑新进展：上下文窗口长了 100 多倍，凭借极长的记忆力，大脑可以从失败中吸取教训

08:55 斯坦福大学提出VisualMimic框架，实现人形机器人视觉引导的全身操控与移动

09:42 复旦大学、上海AI实验室等提出RAD框架，实现基于医学指南的可信多模态临床诊断

10:33 北京大学提出PPGFlowECG：基于跨模态编码器和潜在修正流的PPG到ECG生成框架，实现心血管疾病高精度检测

11:24 高通发布骁龙X2 Elite系列与第五代骁龙8至尊版：终端芯片加速适配智能体AI计算需求

12:22 微软推出芯片内微流体冷却技术，AI基础设施散热效率提升三倍

13:05 Salesforce AI Research等机构发布UserRL框架，通过强化学习训练用户中心的智能体实现多轮交互能力突破

13:48 Suno V5模型发布：AI音乐质量与可控性飞跃，加速行业商业化与大众化进程

14:27 斯坦福大学推出CHURRO：首个专门用于历史文档文本识别的开源视觉语言模型，性能超越Gemini 2.5 Pro且成本低15.5倍

15:06 Google Cloud 发布 AI 创业趋势报告：速度与认知成新壁垒，细分领域与产品创新受推崇

如果你对今天的前沿信号感兴趣或有自己的思考，也欢迎在评论区留言交流，期待与你碰撞更多观点。

LeCun开源自修代码模型,谷歌Veo 3展现零样本学习|奇绩前沿信号0926