Album
时长:
3分钟
播放:
26
发布:
1年前
主播...
简介...
https://xiaoyuzhoufm.com

9月13日,OpenAI又一次震撼发布o1大模型,内部代号“草莓”,相比GPT-4o在通用推理能力方面有显著提升,堪称达到博士生水平。这一集田老师和家人们探讨下草莓o1模型背后的哲学问题。


OpenAI首席科学家、被称为“ChatGPT之父”的llya Sutskever从OpenAI离职后,非常赞赏MIT团队5月发布的一篇论文《柏拉图表征假说》(The Platonic Representation Hypothesis)。我们先讲讲什么是“洞穴寓言”,柏拉图在《理想国》一书中提出了一个思想实验,从前有一个洞穴,洞穴内的囚犯只能看到墙壁上洞外世界物体的影子,久而久之囚犯就把影子当成了对现实的认知,但影子并不是真实世界的准确表达。正如我们眼睛看到、耳朵听到、用手触摸、语言描述的“世界”,都仅仅是现实世界的“投影”。而科学家、哲学家则能够走出这个“洞穴”,通过逻辑、数学、化学、物理等科学手段,透过现象看到本质,用高水平逻辑思维探索世界本源之道。而具有复杂推理能力的草莓o1模型,则像人类科学家一样,排除语言等投影干扰,依靠逻辑推理逼近“道”。


论文中举了个简单的例子,Z是真实世界存在的一个红色圆球、一个紫色圆锥,X是映射到二维图片上的投影,Y则是现实Z的语言文本投影。人类训练了两个AI模型,视觉CV模型fimg


,和文本模型ftext,AI们各自学到了X和Y的表征方式,伴随模型参数规模越来越大、训练数据量越来越大,这两个模型最终会领悟投影背后的真实世界Z表征方式,即立体圆球与立体圆锥的精确数据。


简单来说,当“AI囚徒”(大模型)具有持续提升的复杂推理能力后,就能成为走出洞穴的哲学家,看到比人类感知更精确、更高维度的本源世界。


论文中对“柏拉图表征假说”的描述是,在不同的数据和模态上,以不同目标训练的神经网络,正在它们(AI)的表征空间中汇聚成一个共享的现实统计模型。换句话说,不同算法架构、不同模态的AI模型,变得越来越聪明后,最终都会汇聚到一个“终点目标”,形成对我们所处世界的高维现实准确描述,这不禁令人想起《三体》、《黑客帝国》的世界哲学思考。


我们回到现实,当前的大语言模型LLM的语料是思考、推理的结果,而不反映推理过程,容易隐藏因果逻辑和基础知识。而草莓o1这类新型推理模型,则能通过图片、声音、文字、质量、力、力矩等数据,建立起现实事件联合分布的概率模型,这就是通过多模态模型探索“真实世界”的科学价值,人类能否在21世纪走出“柏拉图洞穴”,超越自身感官维度看世界,就要靠AI和科学家们了。


对《柏拉图表征假说》中英文版报告感兴趣的家人们,请评论区回复“求报告”。关注《田丰说》,每天3分钟,掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧