主播
节目简介
来源:小宇宙
如果你最近关注 AI 圈,一定会频繁听到“世界模型(World Model)”这个词。从颠覆认知的视频生成,到具备复杂推理的大语言模型,再到在实验室里做各种家务的具身智能机器人,几乎所有前沿项目都在宣称自己在构建“世界模型”。
然而,当一个概念包揽了所有最酷的标签时,它也就开始失去本意。把一个画面超逼真但经常放火烧水、公然违背物理常识的视频生成模型,与一个严谨计算力学分布的仿真物理引擎混为一谈,只会模糊掉技术本来的边界和演进路径。世界模型究竟该如何定义?它又将走向何方?
在行业最需要厘清迷雾的时刻,World Labs 联合创始人李飞飞老师在 X上发布了一篇重磅长文。她回归到最经典的强化学习交互循环,为我们带来了清晰、具洞察性的解构路线。
在李飞飞的宏大视野中,世界模型是由追求视觉保真度的“渲染器”、驱动决策和行动的“规划器”,以及严格遵循物理法则的“模拟器”共同构成的三维支柱。而通往“空间智能(Spatial Intelligence)”的漫长征途,正是这三者打破壁垒、走向终极融合的过程。
原文连接:https://x.com/drfeifei/status/2062247238143996275
然而,当一个概念包揽了所有最酷的标签时,它也就开始失去本意。把一个画面超逼真但经常放火烧水、公然违背物理常识的视频生成模型,与一个严谨计算力学分布的仿真物理引擎混为一谈,只会模糊掉技术本来的边界和演进路径。世界模型究竟该如何定义?它又将走向何方?
在行业最需要厘清迷雾的时刻,World Labs 联合创始人李飞飞老师在 X上发布了一篇重磅长文。她回归到最经典的强化学习交互循环,为我们带来了清晰、具洞察性的解构路线。
在李飞飞的宏大视野中,世界模型是由追求视觉保真度的“渲染器”、驱动决策和行动的“规划器”,以及严格遵循物理法则的“模拟器”共同构成的三维支柱。而通往“空间智能(Spatial Intelligence)”的漫长征途,正是这三者打破壁垒、走向终极融合的过程。
原文连接:https://x.com/drfeifei/status/2062247238143996275