奇绩创坛
分享前沿技术趋势洞察与技术创业者的思考和实践

Album
主播:
奇绩创坛
出版方:
奇绩创坛
订阅数:
3,480
集数:
89
最近更新:
1天前
播客简介...
陪伴创业者从0到1,解决创业路上的关键问题
奇绩创坛的创作者...
奇绩创坛的节目...

本周 AI 前沿一览:工具使用解锁模型“无限”能力,单卡实时生成可交互3D世界|奇绩前沿信号【一周特刊】10.25

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:18 苹果公司研究团队发现状态空间模型通过工具使用实现无限长度泛化能力 01:13 复旦大学提出BAPO算法:通过自适应裁剪平衡策略优化,稳定大语言模型离线强化学习训练 02:15 Meta SAM 3:让分割模型从“看见”走向“理解”,开启视觉语义智能新时代 03:08 DeepSeek推出OCR新模型:以视觉压缩文本,革新大模型算力 & 清华大学与智谱AI提出Glyph:通过视觉文本压缩将长文本渲染为图像,在保持性能的同时实现3-4倍上下文压缩和4倍推理加速 04:22 李飞飞团队提出MoMaGen:通过约束优化生成双臂移动机器人多步操作演示数据,实现单个演示扩展至千倍数据集 05:16 GigaAI发布GigaBrain-0:世界模型驱动的视觉-语言-动作模型,开创机器人训练新范式 06:07 李飞飞团队发布 RTFM:单卡实时生成可交互 3D 世界,重塑“世界模型”范式 06:53 腾讯开源 Hunyuan World 1.1:单步生成任意输入的3D世界模型,或将加速具身智能与虚拟场景构建 07:22 上海AI Lab与创智学院发布UniMedVL:医学多模态理解与生成统一模型,在五项医学理解基准和8种医学成像模态上均逼近专用模型性能 08:16 Anthropic发布Claude生命科学版,强化AI在科研全流程中的辅助能力 08:56 英伟达与台积电在美国量产首片Blackwell AI芯片晶圆 — 标志美国本土先进制程制造能力初步落地 09:42 Anthropic发布Claude Agent Skills:从Claude Skills看AI系统的新范式 10:21 快手推出KAT-Coder:通过四阶段训练体系,将代码模型从静态生成器进化为可部署的智能编程代理 11:07 阿里通义千问团队发布Qwen3Guard,实现三级安全分类和实时流式检测的多语言AI安全防护模型 11:50 OpenAI 进军浏览器市场,推出 ChatGPT 浏览器——ChatGPT Atlas 12:34 Karpathy判定“这是Agent的十年”:AGI仍需约十年、路径更偏工程化与渐进式 13:36 马斯克宣布X平台将用Grok全面替代启发式推荐算法,引发关于内容分发公平性与“人类感”的广泛讨论 14:19 Meta AI部门裁员600人,战略重心转向前沿模型研发 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
99+
11小时前

Nano Banana 2预览,谢赛宁团队CLM系统,智能体自适应突破,机器人迎GEN-0时代|奇绩前沿信号1111

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:11 谷歌Nano Banana 2预览:以十秒生成4K图像与逻辑绘制,跨越创作与计算边界 01:15 纽约大学谢赛宁团队提出CLM系统:突破GPU显存限制,单卡训练1亿高斯的3D场景重建 02:32 滑铁卢大学与Salesforce AI提出GROUNDED TEST-TIME ADAPTATION:让大语言模型智能体在新环境中快速适应,实现更强泛化能力 03:28 Generalist AI 推出“GEN-0”躯体基础模型 — 具备大规模物理交互训练能力,可能重塑机器人智能提升路径 04:35 字节跳动等提出视觉空间微调(VST)框架,让视觉语言模型像人一样理解3D空间 05:30 小红书发布DeepEyesV2:首个集成代码执行与网络搜索的主动多模态模型,在复杂推理任务中显著超越现有方案 06:20 马里兰大学与杜比实验室提出VisAlign方法,通过优化文本嵌入显著降低大型视觉-语言模型幻觉现象 07:04 英伟达发布Isaac Lab:支持多模态机器人学习的GPU加速仿真框架 07:46 南京大学等提出Pressure2Motion:通过地面压力与文本引导合成高保真人体运动,开创隐私保护型动作捕捉新范式 08:35 牛津大学提出SigmaDock:基于SE(3)扩散的分子对接方法,首次在化学合理性评估中超越传统物理方法 09:26 埃默里大学等提出CNODE框架:用连续时间神经常微分方程捕捉帕金森病异质性进展轨迹 10:15 信道知识地图构建综述:清华、中科大、东南大学等联合发布从插值到无线辐射场的技术演进路线 11:07 斯坦福大学提出实时推理智能体框架AgileThinker,在动态环境下同时实现深度规划与快速反应 12:01 谷歌在新版 Google Finance 推出 Deep Search 并接入预测市场数据 —— 可能提高普通用户与专业研究者对分散信息的整合与前瞻判断能力 12:56 清华大学发布AgentExpt:基于LLM的AI实验设计自动化框架,实现基线和数据集智能推荐 13:44 快手与南京大学发布SWE-Compass:首个统一评估代码智能体的多维基准,覆盖8类任务、10种编程语言,揭示AI软件工程能力的真实边界 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

14分钟
96
1天前

三大团队视频感知突破,谢赛宁团队空间推理创新,科学AI计划启动,邱锡鹏团队RL与视频推理创新|奇绩前沿信号1110

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:12 纽约大学Yann LeCun,谢赛宁团队与斯坦福大学Li Fei-Fei团队联合发布Cambrian-S:提出视频空间超感知新范式,在空间认知任务上实现30%绝对性能提升 00:56 纽约大学谢赛宁团队等提出SIMS-V框架:用仅2.5万模拟样本训练的7B模型,在空间推理任务上超越72B基线并逼近大型专有模型 01:34 OpenAI启动“AI for Science”计划以加速科研进程并推动政策协同 02:11 复旦大学、创智学院邱锡鹏OpenMOSS团队与M-A-P提出RLoop框架:通过迭代策略初始化让强化学习实现自我改进,数学推理准确率提升9% 03:02 复旦、创智学院邱锡鹏OpenMOSS团队提出Thinking with Video范式:视频生成作为统一多模态推理的新路径 04:01 斯坦福大学提出因果干预表征发散问题及反事实潜在损失解决方案,提升神经网络可解释性方法的可靠性 04:40 哥伦比亚大学证明布尔函数单调性测试需要近 n^(1/2) 次查询,几乎达到最优下界 05:13 xAI升级Grok 4 Fast:200万token上下文开启“整本书级”推理时代 05:38 纽约大学提出"在测试集上训练"诊断框架,系统揭露多模态基准中可被利用的非视觉捷径,并创建去偏版本基准 06:18 英伟达发布Nemotron Nano V2 VL:12B参数多模态模型,在文档理解和长视频推理上实现显著突破 06:53 南京大学与腾讯混元提出UniAVGen:通过非对称跨模态交互实现统一的音视频生成 07:33 xAI升级Grok Imagine:图生逼真至真假难辨 08:02 清华大学等提出视觉驱动的人形机器人反应式足球技能学习框架,在RoboCup 2025和世界人形机器人运动会中夺冠 08:43 多所世界名校联合发布论文,提出前馈式3D重建综述:加速从像素到世界的生成范式 09:19 从零生成原子级精度抗体:RFdiffusion实现去 novo 抗体设计的实验验证 10:04 中国太空计算星座已运行半年,全球算力基础设施竞争延伸至近地轨道 10:36 斯坦福大学与NVIDIA等机构联合提出:AI时代存储层级重构,将DRAM-闪存缓存阈值从分钟级压缩至秒级 11:15 Meta等机构提出DreamGym:首个通过合成经验数据实现大规模智能体强化学习的统一框架 11:55 微软等发布GUI-360°:首个120万步大规模桌面智能体数据集,在三大核心任务上实现统一评估 12:35 Sandbar发布“会听耳语”的AI智能戒指Stream Ring,内置聊天机器人,支持语音转写 13:03 华为诺亚研究院提出E-CARE框架:用单次LLM推理实现高效常识增强推荐,搜索精度提升12.1% 13:46 卡内基梅隆大学与加州大学伯克利分校发布EDIT-Bench,首个基于真实开发场景的代码编辑能力评测基准,涵盖545个问题,揭示顶尖模型仅60%通过率 14:27 AI2050公布2025年度28位研究员名单,聚焦AI安全、科学智能与可信系统 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

15分钟
86
2天前

本周 AI 前沿一览:AI功能性内省能力,多模态与推理能力迎新里程碑|奇绩前沿信号【一周特刊】11.8

奇绩创坛

奇绩前沿信号播客——全球 AI 前沿的情报站 奇绩前沿信号依托奇绩内部的研究体系,持续追踪并解读全球 AI 领域前沿的论文和产品动态。 我们将这些内容以 AI 与生成播客的形式分享,用通俗易懂的方式呈现复杂技术,帮助你快速理解技术趋势背后的核心逻辑、潜在影响和未来发展方向。 播客每日分享内容由奇绩行研实习生与 AI 共创,播客语音由 OpenMOSS (奇绩 2025 年春季创业营校友企业模型)支持。 针对每日前沿信号内容,我们还准备了进阶版的解读,提供更系统、深入的分析,涵盖实验成果与价值评估、方法与技术原理、应用场景与潜力判断、总结与前沿洞察等多个维度。 点击下方链接获取完整版内容,也欢迎扫描时间轴下方二维码加入奇绩前沿信号交流群,一起追踪 AI 最前沿的信息。 apply.miracleplus.com 【奇绩前沿信号介绍】 * 基于对全球 500+ 顶尖机构、3000+ 核心人才的实时追踪,只捕捉那些“刚刚发生、尚未扩散、但注定改变格局”的信号: * 认知模型突破、多模态跃迁、智能体进化…… * OpenAI、Anthropic、DeepSeek、Kimi、字节……巨头与新锐的关键动向 * Infra 演进、AI4S 落地、产业重构……高价值趋势的早期征兆 【时间轴】 00:34 Anthropic通过概念注入法证明LLM具备功能性内省能力 01:21 上海交通大学,创智学院刘鹏飞团队等机构提出上下文工程2.0:从人机交互到人机协同的二十年演进,构建通往超人智能的上下文认知框架 02:06 Sea AI Lab与新加坡国立大学发现FP16精度可根本性解决大语言模型强化学习训练中的训练-推理不匹配问题,实现更稳定、更快速的模型优化 02:53 复旦大学与创智学院邱锡鹏团队提出MARAG-R1:通过强化学习实现多工具协同的检索增强生成框架,在全局推理任务上达到新SOTA 03:34 复旦大学与创智学院邱锡鹏团队提出Zero-RAG:通过消除冗余知识将检索语料库缩减30%,检索速度提升22% 04:16 清华大学提出Diffuse Thinking框架:用扩散语言模型高效提出推理思路,实现计算效率与推理准确性双重提升 04:47 Hugging Face 发布《Smol训练手册》:揭秘构建世界级小型语言模型的完整方法论,SmolLM3以3B参数实现多语言推理突破 05:27 新加坡国立大学与奇绩智峰等发布扩散语言模型研究:在数据受限场景下实现超越自回归模型3倍以上的数据利用效率 05:54 北京智源研究院发布“悟界·Emu3.5”,首次实现从语言预测到世界状态预测的跨越 06:26 美团发布LongCat-Flash-Omni:首个开源5600亿参数全模态实时交互模型,实现毫秒级音视频响应 06:57 昆仑万维发布SkyReels全新V3平台,开启AI多模态视频创作“零门槛时代” 07:33 Agent-Omni:亚马逊等机构提出测试时多模态推理框架,通过模型协同实现"理解一切" 08:13 小鹏汽车的全新一代机器人IRON 亮相 AI Day,具有类似人类的脊柱、仿生肌肉和覆盖全身的柔软感官皮肤 08:43 OpenAI与AWS达成380亿美元算力合作 — 多云战略加速AI基础设施格局重构 09:15 谷歌启动Project Suncatcher:探索基于太空的可扩展AI基础设施对算力与能源范式的潜在影响 09:44 OpenAI发布Aardvark:让AI成为自动化安全研究员的新纪元 10:14 上海交大与创智学院刘鹏飞团队发布APOLLO:通过异步人机协作训练,让AI智能体在长期复杂任务中表现提升50%以上 10:45 Anthropic提出带批判性压力的代码执行方法(MCP),赋予AI自我调试与修正的能力 11:22 谷歌DeepMind整合AI模型以绘制、模拟和理解自然,旨在提升全球生态保护决策的规模与效率 11:58 复旦大学与创智学院邱锡鹏团队提出GlobalQA基准和GlobalRAG框架,首次系统性解决大规模语料库级推理问题,在全局检索增强生成任务上实现F1分数从1.51提升至6.63的突破 12:37 上海交大与创智学院刘鹏飞团队发布InnovatorBench,构建首个端到端AI研究Agent评估基准,支持36小时长时程创新任务 13:09 复旦大学与上海创智学院等提出UniREditBench:首个统一推理驱动的图像编辑基准,覆盖真实与游戏世界场景,达成多模态双参考评估 如果你对今天的前沿信号感兴趣或有自己的思考,也欢迎在评论区留言交流,期待与你碰撞更多观点。

14分钟
99+
4天前
奇绩创坛的评价...

空空如也

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧