田丰说 - 第98集 OpenAI Sora团队的“三年之约”！ - EarsOnMe

主播

节目简介

来源：小宇宙

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。

田老师认为，如刚出生的人类婴儿一样，端到端的多模态大模型将成为物理AI的下一步。

全球AI要闻，OpenAI公司Sora团队为视频领域设计一套尺度定律。

日前，OpenAI公司的Sora项目团队Aditya Ramesh、Tim Brooks和Bill Peebles，与硅谷知名投资人Elad Gil和知名播客Sarah Guo进行对谈，Sora团队强调，在AI领域总是面临着快速行动的压力。最直接的方法通常是采用当前有效的技术。但有时候需要退一步，思考三年后的长期解决方案。研究团队每天都在解决的问题是，如果使用相同的训练计算量，能否在不增加计算需求的前提下得到更好的效果？Sora如何学习视频数据，从头生成更复杂的长期物理互动、更精确的内容，最好方法就是预测数据，以可扩展的方式学习智能。

亮点1，AI当前最主要的问题是控制性。Sora团队一直在考虑未来如何扩展模型的功能，使其能接受文本之外的其他类型的输入。

亮点2，未来Sora或其他模型的内容将被认可成为专业制作工具，人们也会找到全新的方式来使用这些模型，那可能出现全新的互动内容方式，模型将赋予人们一种能力，理解个人审美观。

亮点3，OpenAI过去投入了很多物理世界的训练数据，比如语言、手臂和关节如何在空间中移动的细节，AI通过对原始视频的学习，成为未来实现AI物理实体化的关键。

亮点4，OpenAI在视频中首次应用端到端深度学习。Sora的新架构Diffusion Transformer使我们能够扩展这些模型的规模。

每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

第98集 OpenAI Sora团队的“三年之约”！

加入我们的 Discord

扫描微信二维码

播放列表