田丰说 - 第226集解密“草莓”o1 柏拉图表征假说！（下） - EarsOnMe

主播...

简介...

9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。这一集田老师和家人们探讨下草莓o1模型背后的哲学问题。

OpenAI首席科学家、被称为“ChatGPT之父”的llya Sutskever从OpenAI离职后，非常赞赏MIT团队5月发布的一篇论文《柏拉图表征假说》(The Platonic Representation Hypothesis)。我们先讲讲什么是“洞穴寓言”，柏拉图在《理想国》一书中提出了一个思想实验，从前有一个洞穴，洞穴内的囚犯只能看到墙壁上洞外世界物体的影子，久而久之囚犯就把影子当成了对现实的认知，但影子并不是真实世界的准确表达。正如我们眼睛看到、耳朵听到、用手触摸、语言描述的“世界”，都仅仅是现实世界的“投影”。而科学家、哲学家则能够走出这个“洞穴”，通过逻辑、数学、化学、物理等科学手段，透过现象看到本质，用高水平逻辑思维探索世界本源之道。而具有复杂推理能力的草莓o1模型，则像人类科学家一样，排除语言等投影干扰，依靠逻辑推理逼近“道”。

论文中举了个简单的例子，Z是真实世界存在的一个红色圆球、一个紫色圆锥，X是映射到二维图片上的投影，Y则是现实Z的语言文本投影。人类训练了两个AI模型，视觉CV模型fimg

，和文本模型ftext，AI们各自学到了X和Y的表征方式，伴随模型参数规模越来越大、训练数据量越来越大，这两个模型最终会领悟投影背后的真实世界Z表征方式，即立体圆球与立体圆锥的精确数据。

简单来说，当“AI囚徒”（大模型）具有持续提升的复杂推理能力后，就能成为走出洞穴的哲学家，看到比人类感知更精确、更高维度的本源世界。

论文中对“柏拉图表征假说”的描述是，在不同的数据和模态上，以不同目标训练的神经网络，正在它们(AI)的表征空间中汇聚成一个共享的现实统计模型。换句话说，不同算法架构、不同模态的AI模型，变得越来越聪明后，最终都会汇聚到一个“终点目标”，形成对我们所处世界的高维现实准确描述，这不禁令人想起《三体》、《黑客帝国》的世界哲学思考。

我们回到现实，当前的大语言模型LLM的语料是思考、推理的结果，而不反映推理过程，容易隐藏因果逻辑和基础知识。而草莓o1这类新型推理模型，则能通过图片、声音、文字、质量、力、力矩等数据，建立起现实事件联合分布的概率模型，这就是通过多模态模型探索“真实世界”的科学价值，人类能否在21世纪走出“柏拉图洞穴”，超越自身感官维度看世界，就要靠AI和科学家们了。

对《柏拉图表征假说》中英文版报告感兴趣的家人们，请评论区回复“求报告”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

空空如也

加入我们的 Discord

扫描微信二维码

播放列表