关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。
田老师认为,如刚出生的人类婴儿一样,端到端的多模态大模型将成为物理AI的下一步。
全球AI要闻,OpenAI公司Sora团队为视频领域设计一套尺度定律。
日前,OpenAI公司的Sora项目团队Aditya Ramesh、Tim Brooks和Bill Peebles,与硅谷知名投资人Elad Gil和知名播客Sarah Guo进行对谈,Sora团队强调,在AI领域总是面临着快速行动的压力。最直接的方法通常是采用当前有效的技术。但有时候需要退一步,思考三年后的长期解决方案。研究团队每天都在解决的问题是,如果使用相同的训练计算量,能否在不增加计算需求的前提下得到更好的效果?Sora如何学习视频数据,从头生成更复杂的长期物理互动、更精确的内容,最好方法就是预测数据,以可扩展的方式学习智能。
亮点1,AI当前最主要的问题是控制性。Sora团队一直在考虑未来如何扩展模型的功能,使其能接受文本之外的其他类型的输入。
亮点2,未来Sora或其他模型的内容将被认可成为专业制作工具,人们也会找到全新的方式来使用这些模型,那可能出现全新的互动内容方式,模型将赋予人们一种能力,理解个人审美观。
亮点3,OpenAI过去投入了很多物理世界的训练数据,比如语言、手臂和关节如何在空间中移动的细节,AI通过对原始视频的学习,成为未来实现AI物理实体化的关键。
亮点4,OpenAI在视频中首次应用端到端深度学习。Sora的新架构Diffusion Transformer使我们能够扩展这些模型的规模。
每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
空空如也
暂无小宇宙热门评论