关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。
田老师认为,当前的基础大模型正在依赖尺度定律更庞大的算力、数据、参数快速提升能力水平,23年到25年的大模型能力会从本科生提升到博士生智力水平,AI原生公司需要在3至6个月升级的基础大模型上,找到降低成本的应用实践,从而让AI应用能在产业场景中跟上基础大模型的市场预期,微软All in AI就是通过千亿美元级别大笔投资更庞大的AI超级计算中心。
全球AI要闻,微软CTO分享搞大模型最容易犯的错。
7月10日,微软公司CTOKevin Scott与红杉资本合伙人Pat Grady、Bill Coughran对话分享:“我认为在Scaling(尺度定律)这件事上,微软稍微有点落后,2017年后我们没有很快把所有鸡蛋都放进正确的篮子里,虽然在AI上花了很多钱,也只是不想伤害‘内部聪明人’的感情,但这些钱被分散在一大堆不同的事情上,甚至不知道诊断结果是什么。我们没有笃定规模才是最重要的 。我重组了微软内部,更加专注AI。在2019年战略投资和OpenAI合作,一起探索构建AI平台的基础系统是什么。”
亮点1,目前整个领域最有趣的是,前沿模型的能力确实呈指数级增长,而且还没有达到规模边际收益递减的程度。2019年,微软对尺度定律有了清晰的认识,当时有两三个选择,在CEO纳德拉和CTO Kevin看来,选OpenAI是让我们自力更生并进入正轨的最快方法。
亮点2,Scaling的影响是每隔几年一次,因为建造超级计算机并大规模训练需要时间,下一代大模型即将问世。6月初微软也提到已见到了PhD-level博士智能水平的模型。微软AI板块CEO、前Inflection创始人Mustafa Suleyman预测,2年内会见到完成Agent能力的博士智力模型,而不是热议的GPT-5。
亮点3,微软内部反思,产品研发会犯的错误就是,认为解决问题的唯一方法就是我必须去利用前沿模型,并用一大堆东西来补充。要让自己有足够的灵活性,以便前沿模型出现,迅速适应它。
亮点4,一种扼杀是,团队看到前沿模型后,说绝对不可能在此基础上部署产品,因为太贵了,然后开始要人和GPU,他们要建立一个特定的模型,与前沿模型边界性能相似,成本便宜些。但前沿模型一迭代,新的点就把当下产品碾压了。
每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!
空空如也
暂无小宇宙热门评论