节目列表: 田丰说 - EarsOnMe - 精选播客，一听即合

所以科研理论我们接着去看从物理学上来讲就是从实验观察到唯象理论再到了一种框架唯象理论就是没有经过严谨论证的这个总结实验总结比如说天象观测当时大家觉得所有的这个地球是中心而且呢所有的轨道都是圆的后来发现不对这玩意怎么都对不上有些行星的轨迹他们就套大圆套小圆套一堆模型这个模型就非常复杂这个就不对了后来开普勒说那有没有可能是椭圆的后来用椭圆的这个事能解释开普勒三定律但是开普勒这个人的数学不好所以他这个后面他找不到精确的理论框架牛顿出来以后牛顿数学非常好发明了微积分发明了万有引力然后完美的去解释了开普勒的三定律这个人工智能也一样人工智能呢现在有超大规模的集群计算集群我们去做大模型的训练有一个实验为什么现在这个像李飞飞教授说大模型都是在企业里面创新高校里很少因为高校没有卡大部分算力都在企业啊所以现在企业更像是一个就中国政府说的这个叫创新的主体是民企民企啊但是现在央国企的算力也开始建设起来了有了这个实验环境你才能去做这个大模型的训练和创新然后就发现了一个唯象理论叫做上一个时代是实际上是深度学习的时代叫AlphaGo这个时代所以我们发现了强化学习等等这样的一些实验的理论这个其实在心理学上叫行为主义就是这个下围棋我这个我下的好给这个AlphaGo一个奖赏就是加分下的不好给你减分 AlphaGo自己跟自己下这个 AlphaGo就训练出来围棋的这个水平了其实人也一样管理学你想一想哎员工做的好我给他一个奖励员工做不好就给他扣分对吧或者罚钱其实这个都是一个这个机械化的一种理论然后那么现在大模型的这个理论叫尺度定律我们叫Scaling Law 它要不断的去变大啊 OpenAI就是压住说越大越好就是就跟我们做菜一样这个菜里面一共有三个元素第一个叫算力第二个叫数据第三个叫模型的参数这三个东西越大越好所以我们说这口锅就是算力你没有大集群你根本这个菜都炒不出来第二个就是你的数训练数据集得足够大你学的东西越多越多元化他这个仿真世界的就是学习这个世界的这个规模就会越好第三个就是人脑是有复杂度的所以大模型也有复杂度只不过现在人脑复杂度比大模型高大概100倍其实也不远了为什么大家预测 2028年有可能实现通用人工智能就因为到那个时候大模型按照尺度定律来说再膨胀两个数量级就达到人脑的复杂度那是不是我们AI就AGI就出现了就强人工智能就出现了但是这个都是实验总结的就一个趋势性的东西那我们特别期待说后面有这个理论框架出来真正指导我们未来几十年的发展你像量子力学狭义相对论指导100年了现在这些红利还没有释放完非常有价值

3分钟

19

1年前

第229集钱学森预测21世纪

田丰说

然后那么我们接着说这个1955年战略科学家眼中的21世纪很厉害现在可能也就是70年的时间钱老先生其实当年就预测了说中国航天奠基人是钱学森那他当时是觉得火箭运载上太空的太多东西太贵了所以很多这个未来的更多的飞船的组装很多是在近地轨道上那么怎么保证一个低成本的这个近地轨道的这个运载呢其实要有可回收拾的火箭所以不是马斯克提出来的那我放的这个照片其实也是中国的可回收的火箭今天其实中国航天部也发布了一个消息就是这个我们的回收国家队也成功了做这个火箭回收那第二个预言呢是按照方法论其实它是当时没有太空站这个概念 1955年只有这个卫星的概念不管是苏联还是咱们那么当时钱老先生就提出说我们在近地轨道上应该有一个星际码头把我们去发往火星或者发往其他地区的各种的这个行程都在这个近地码头上去做组装这个是很重要的而且在火星那一端也得有一个近地轨道上的这个星际码头形成一个就是地火的这样的一个旅行啊先从先从用这个可回收的火箭从地表基地进入到这个地球的太空站然后从地球的太空站发射这个这个飞船到火星的太空站然后从火星的太空站再通过这个火箭再回到这个火星的地表的基地实际上是有这么一个四段论那么从这个角度来看呢我们说为什么必须得用火箭是吧不能像这个流浪地球里面用这个太空电梯因为我们材料学没突破所以现在的这个纳米科技是有希望的中国呢其实不管是人工智能的芯片还是这个我们说航天其实很重要的一点是要怎么去加速新材料的研发

2分钟

35

1年前

第228集 “AI手机” 能干什么?

田丰说

那我们说人工智能进入今年我们说的终端这个是一个热点哪些终端呢第一大终端就是AI手机黄仁勋说移动的物体都是机器人一切移动的那么最大的量呢就是手机所以呢手机里面会有这个AI助手 Siri会升级小爱同学会升级其他的都会升级然后那么43亿人这个手机都会更新换代然后呢一天呢大家使用手机6个小时交互的频次呢也很高涉及到很多场景所以这是AI最好的嵌入那现在AI在手机上面有四大场景体验了四种能力第一个叫做百科知识助手的能力我想查任何知识我都不查搜索引擎了我直接查他上半年我写了本书以前写书得用各种搜索引擎查资料我现在其实有60%-80% 都是用这个AI助手直接去搜集的甚至复杂的一些搜集完再去做整合内容的整合和分析都是用的这个知识助手的能力它体现的是对这个世界知识的一种感知第二个呢是办公助手比如说我在地铁上突然收到领导说改一下这个PPT 或者改一下这个文章那就直接让智能体可以去改很方便这就是一个办公和语言助手包括我去看比如说有一篇AI的论文是日文的德文的还看不懂没关系扔给这个商汤的这个商量让他帮我总结一下里面所有的这个内容很方便甚至多篇论文都可以做总结还有就是这个智能的这个视觉娱乐助手就是AI呢可以去感知一会儿我们也会有例子 AI可以像人一样去感知这个万事万物这个也很重要在手机上比如说我看到一个花儿不知道名字用这个这个大模型它就和我分析出来了这个还有像日程管理的助手商汤现在就有一个这样的一个产品就是帮助你去就像你的一个小助理一样帮你管理所有的日程谷歌也有就是比如说家长这个经常可能幼儿园学校会发邮件外国人比较喜欢发邮件那这个AI助手就帮你把这个议程都顺出来

2分钟

47

1年前

第227集 AI终极价值在于“控制”

田丰说

那么接着看就是钱学森老先生有一句话我觉得非常具有这个战略指导意义他当时去讲的是计算机他说计算机真正的价值不在计算而在于控制这个很有哲学就是人工智能的价值其实不在于计算而在于他控制的对象人工智能能卖出大价钱那看他控制的是什么控制的是机床还是控制的是一辆自动驾驶的汽车还是控制的是一个这个无人机对吧你的对象往往决定了你的市场价值所以美国在看起来好像美国很热闹很多时候还是顺着互联网的这个to c 这个角度在去走但是中国的人工智能其实从第一天开始就瞄着是to b产业的问题所以我说在这个领域人工智能呢可能有四个重要的大的课题四个行业要去做突破这四个行业突破那钱学森老先生说的这个第二次工业革命就快实现了第一个叫做这个能源人类的根本问题在于能源如果人工智能能够去发现新的能源比如可控核聚变等等这个就有巨大的机会就是发现新能源发现新能源的这种生产方式第二个呢是这个制造就我们说能源和制造是一体的就是把地球上的资源转化成产品所以AI 能不能解决这个制造业类的核心问题这个是关键点第三个是什么第三个行业和第四个行业就不是从0到1了实际上它是把这个生产出来的产品从产地方运到销售方那就是交通第三个是交通第四个是通信通信可以认为它是一种媒介但是它运送的是无形的商品就是什么电影音乐啊什么论文啊这些东西所以从能源制造到这个交通和通信大家会看历史上任何一次人类文明的大的跃迁都是这四个东西同时发生变化所以人工智能如果能解决这四个产业里面的一个或者多个这个核心问题那么整个人类文明就会有一个巨大的进步在这个也是控制的对象的意思我们控制什么很重要然后那么黄仁勋这个今年其实英伟达股票涨得非常好虽然最近有回调那黄仁勋呢对未来也有一个预判他既然可以在20年前去看到现在的一些趋势或者10年前去压注这个算力那么也说明他其实对未来的这个预测有一些借鉴意义比如说他认为未来所有会移动的东西都能实现自主化就比如说你们家有一个扫地机器人这扫机器人现在很笨的基本上没脑子这卷到袜子卷到线甚至对着玻璃就不停的在那怼因为他玻璃识别不出来就有很多问题但是他没有自主化那什么叫有自主化就是他能够不断的去学习今天卷到线了明天就不会再去卷就这些问题甚至你给他放到一个陌生的环境他也能自动的去做建模现在在仓储环境里的机器人 AGV是可以自动建模的这都可以所以这个叫自主化所有会移动的东西都是机器人这个就是黄仁勋说的一件事大家想想这个空间可就大了所有会移动的

3分钟

26

1年前

第226集解密“草莓”o1 柏拉图表征假说！（下）

田丰说

9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。这一集田老师和家人们探讨下草莓o1模型背后的哲学问题。 OpenAI首席科学家、被称为“ChatGPT之父”的llya Sutskever从OpenAI离职后，非常赞赏MIT团队5月发布的一篇论文《柏拉图表征假说》(The Platonic Representation Hypothesis)。我们先讲讲什么是“洞穴寓言”，柏拉图在《理想国》一书中提出了一个思想实验，从前有一个洞穴，洞穴内的囚犯只能看到墙壁上洞外世界物体的影子，久而久之囚犯就把影子当成了对现实的认知，但影子并不是真实世界的准确表达。正如我们眼睛看到、耳朵听到、用手触摸、语言描述的“世界”，都仅仅是现实世界的“投影”。而科学家、哲学家则能够走出这个“洞穴”，通过逻辑、数学、化学、物理等科学手段，透过现象看到本质，用高水平逻辑思维探索世界本源之道。而具有复杂推理能力的草莓o1模型，则像人类科学家一样，排除语言等投影干扰，依靠逻辑推理逼近“道”。论文中举了个简单的例子，Z是真实世界存在的一个红色圆球、一个紫色圆锥，X是映射到二维图片上的投影，Y则是现实Z的语言文本投影。人类训练了两个AI模型，视觉CV模型fimg ，和文本模型ftext，AI们各自学到了X和Y的表征方式，伴随模型参数规模越来越大、训练数据量越来越大，这两个模型最终会领悟投影背后的真实世界Z表征方式，即立体圆球与立体圆锥的精确数据。简单来说，当“AI囚徒”（大模型）具有持续提升的复杂推理能力后，就能成为走出洞穴的哲学家，看到比人类感知更精确、更高维度的本源世界。论文中对“柏拉图表征假说”的描述是，在不同的数据和模态上，以不同目标训练的神经网络，正在它们(AI)的表征空间中汇聚成一个共享的现实统计模型。换句话说，不同算法架构、不同模态的AI模型，变得越来越聪明后，最终都会汇聚到一个“终点目标”，形成对我们所处世界的高维现实准确描述，这不禁令人想起《三体》、《黑客帝国》的世界哲学思考。我们回到现实，当前的大语言模型LLM的语料是思考、推理的结果，而不反映推理过程，容易隐藏因果逻辑和基础知识。而草莓o1这类新型推理模型，则能通过图片、声音、文字、质量、力、力矩等数据，建立起现实事件联合分布的概率模型，这就是通过多模态模型探索“真实世界”的科学价值，人类能否在21世纪走出“柏拉图洞穴”，超越自身感官维度看世界，就要靠AI和科学家们了。对《柏拉图表征假说》中英文版报告感兴趣的家人们，请评论区回复“求报告”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。

3分钟

26

1年前

第225集解密“草莓” OpenAI o1！（中）

田丰说

9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。吃瓜一，草莓大模型的前身是神秘的Q-star模型，2023年11月，路透社独家报道了OpenAI秘密研发Q-star项目，被内部员工认为是迈向AGI的重大突破，引发了研发团队对AI安全的担忧，并直接引发了OpenAI董事会驱逐CEO Sam Altman、首席科学家llya出走等一系列重大事件。另外，也有人猜测草莓项目起源于OpenAI 2021年启动的GPT-Zero项目，类似谷歌AlphaZero的自主学习方向。吃瓜二，草莓大模型回答复杂推理问题需要十几秒甚至一分钟的时间，背后是自我反思机制，包括主动检查与改进，即对最终结果、也对推理步骤都进行反思迭代，这彻底突破了RLHF人类反馈AI改进的瓶颈，由模型替代人类监督评价自身推理过程，又称为“自举”机制，像人类科学家一样自我驱动持续钻研难题。2024年6月，OpenAI提出CriticGPT，配合人工能够有效检查出大语言模型的生成错误。同期，OpenAI提出了Prover-Verifier Games，构建了验证模型和推理模型的博弈框架。吃瓜三，2024年8月7日，OpenAI CEO Sam Altman在X社交媒体上发布了一章草莓照片，暗示草莓项目（o1模型）即将发布，引发一系列传言和猜想。在OpenAI定义的5级AGI体系中，草莓项目是L2级AI“推理者”的关键一步，能够解决博士水平的基本问题，其后3级分别是L3具有行动力的智能体、L4擅用创新力的创新者、L5组织工作效能的智能组织体。吃瓜四，草莓项目o1模型，为下一代基础模型生成高质量合成数据，减少幻觉。OpenAI下一代大模型不叫“GPT-5”，而是称为“猎户座Orin”，具有文本、图像、声音、视频等多模态数据的理解、推理能力，更自然地与人类、与环境交互，预计猎户座大模型将于11月大选后发布。吃瓜五，草莓o1模型具有可泛化的复杂推理能力。包括常识推理、数学推理、搜索推理评价反思能力，可以泛化到化学、物理推理任务中。人类的通用推理能力与记忆力无关，尺度定律驱动大模型参数量变大，带来语言大模型更善于记忆，而草莓o1新型推理大模型善于严谨思维，正在走出不同于尺度定律的工程化创新路径。此外，草莓o1善于利用代码解释器、多智能体反馈等工具，拓展自己的能力边界。吃瓜六，AI展现了自我进化能力的“先兆”，AI的思维链CoT越变越长，代表着思考推理过程的复杂化、深度化。凭借推理技能，草莓o1模型能通过小规模语料，自主发现学习、反思改进搜索、探索新策略、借用外部工具校验准确性，从而更好地适应环境，推动多智能体协同演化，颇有达尔文“物种进化”理论的变种，这方面的进一步思考请看《田丰说》“解密草莓”系列的“下集”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。家人们的点赞、收藏、分享，是对田老师录课的最大支持！

3分钟

39

1年前

第224集解密“草莓” OpenAI o1！（上）

田丰说

9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。吃瓜一，草莓大模型的前身是神秘的Q-star模型，2023年11月，路透社独家报道了OpenAI秘密研发Q-star项目，被内部员工认为是迈向AGI的重大突破，引发了研发团队对AI安全的担忧，并直接引发了OpenAI董事会驱逐CEO Sam Altman、首席科学家llya出走等一系列重大事件。另外，也有人猜测草莓项目起源于OpenAI 2021年启动的GPT-Zero项目，类似谷歌AlphaZero的自主学习方向。吃瓜二，草莓大模型回答复杂推理问题需要十几秒甚至一分钟的时间，背后是自我反思机制，包括主动检查与改进，即对最终结果、也对推理步骤都进行反思迭代，这彻底突破了RLHF人类反馈AI改进的瓶颈，由模型替代人类监督评价自身推理过程，又称为“自举”机制，像人类科学家一样自我驱动持续钻研难题。2024年6月，OpenAI提出CriticGPT，配合人工能够有效检查出大语言模型的生成错误。同期，OpenAI提出了Prover-Verifier Games，构建了验证模型和推理模型的博弈框架。吃瓜三，2024年8月7日，OpenAI CEO Sam Altman在X社交媒体上发布了一章草莓照片，暗示草莓项目（o1模型）即将发布，引发一系列传言和猜想。在OpenAI定义的5级AGI体系中，草莓项目是L2级AI“推理者”的关键一步，能够解决博士水平的基本问题，其后3级分别是L3具有行动力的智能体、L4擅用创新力的创新者、L5组织工作效能的智能组织体。吃瓜四，草莓项目o1模型，为下一代基础模型生成高质量合成数据，减少幻觉。OpenAI下一代大模型不叫“GPT-5”，而是称为“猎户座Orin”，具有文本、图像、声音、视频等多模态数据的理解、推理能力，更自然地与人类、与环境交互，预计猎户座大模型将于11月大选后发布。吃瓜五，草莓o1模型具有可泛化的复杂推理能力。包括常识推理、数学推理、搜索推理评价反思能力，可以泛化到化学、物理推理任务中。人类的通用推理能力与记忆力无关，尺度定律驱动大模型参数量变大，带来语言大模型更善于记忆，而草莓o1新型推理大模型善于严谨思维，正在走出不同于尺度定律的工程化创新路径。此外，草莓o1善于利用代码解释器、多智能体反馈等工具，拓展自己的能力边界。吃瓜六，AI展现了自我进化能力的“先兆”，AI的思维链CoT越变越长，代表着思考推理过程的复杂化、深度化。凭借推理技能，草莓o1模型能通过小规模语料，自主发现学习、反思改进搜索、探索新策略、借用外部工具校验准确性，从而更好地适应环境，推动多智能体协同演化，颇有达尔文“物种进化”理论的变种，这方面的进一步思考请看《田丰说》“解密草莓”系列的“下集”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。家人们的点赞、收藏、分享，是对田老师录课的最大支持！事实如何呢？让我们看看国内著名第三方AI评测机构SuperCLUE的“买家秀”，共302道中文复杂高阶推理题，包括多步推理、数字推理、推理计算、市场分析和最优化问题五个高难度推理任务。 9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。吃瓜一，草莓大模型的前身是神秘的Q-star模型，2023年11月，路透社独家报道了OpenAI秘密研发Q-star项目，被内部员工认为是迈向AGI的重大突破，引发了研发团队对AI安全的担忧，并直接引发了OpenAI董事会驱逐CEO Sam Altman、首席科学家llya出走等一系列重大事件。另外，也有人猜测草莓项目起源于OpenAI 2021年启动的GPT-Zero项目，类似谷歌AlphaZero的自主学习方向。吃瓜二，草莓大模型回答复杂推理问题需要十几秒甚至一分钟的时间，背后是自我反思机制，包括主动检查与改进，即对最终结果、也对推理步骤都进行反思迭代，这彻底突破了RLHF人类反馈AI改进的瓶颈，由模型替代人类监督评价自身推理过程，又称为“自举”机制，像人类科学家一样自我驱动持续钻研难题。2024年6月，OpenAI提出CriticGPT，配合人工能够有效检查出大语言模型的生成错误。同期，OpenAI提出了Prover-Verifier Games，构建了验证模型和推理模型的博弈框架。吃瓜三，2024年8月7日，OpenAI CEO Sam Altman在X社交媒体上发布了一章草莓照片，暗示草莓项目（o1模型）即将发布，引发一系列传言和猜想。在OpenAI定义的5级AGI体系中，草莓项目是L2级AI“推理者”的关键一步，能够解决博士水平的基本问题，其后3级分别是L3具有行动力的智能体、L4擅用创新力的创新者、L5组织工作效能的智能组织体。吃瓜四，草莓项目o1模型，为下一代基础模型生成高质量合成数据，减少幻觉。OpenAI下一代大模型不叫“GPT-5”，而是称为“猎户座Orin”，具有文本、图像、声音、视频等多模态数据的理解、推理能力，更自然地与人类、与环境交互，预计猎户座大模型将于11月大选后发布。吃瓜五，草莓o1模型具有可泛化的复杂推理能力。包括常识推理、数学推理、搜索推理评价反思能力，可以泛化到化学、物理推理任务中。人类的通用推理能力与记忆力无关，尺度定律驱动大模型参数量变大，带来语言大模型更善于记忆，而草莓o1新型推理大模型善于严谨思维，正在走出不同于尺度定律的工程化创新路径。此外，草莓o1善于利用代码解释器、多智能体反馈等工具，拓展自己的能力边界。吃瓜六，AI展现了自我进化能力的“先兆”，AI的思维链CoT越变越长，代表着思考推理过程的复杂化、深度化。凭借推理技能，草莓o1模型能通过小规模语料，自主发现学习、反思改进搜索、探索新策略、借用外部工具校验准确性，从而更好地适应环境，推动多智能体协同演化，颇有达尔文“物种进化”理论的变种，这方面的进一步思考请看《田丰说》“解密草莓”系列的“下集”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。家人们的点赞、收藏、分享，是对田老师录课的最大支持！有兴趣而且数学不错的朋友，可以自己推导下这道多步推理任务的AI考题。某文化节上有四位演员（A,B,C,D）分别在时段1到4进行表演。提供以下条件：条件1，第4时段的表演人数多于其他任何时段。条件2，第1时段不能是单人表演。条件3，不能连续两场单人表演。条件4，每名演员至少表演一次，但不能连续两场表演。条件5，B和C必定同时登场。条件6，D参加了第1时段的表演，A没有参加第4时段的表演。请问各位演员的具体表演时段如何安排？出题45秒后o1模型给出了解题过程和正确答案：各时段演员安排如下：时段1，安排演员A、D。时段2，安排演员B、C。时段3，安排演员A。时段4，安排演员B、C、D。 9月13日，OpenAI又一次震撼发布o1大模型，内部代号“草莓”，相比GPT-4o在通用推理能力方面有显著提升，堪称达到博士生水平。吃瓜一，草莓大模型的前身是神秘的Q-star模型，2023年11月，路透社独家报道了OpenAI秘密研发Q-star项目，被内部员工认为是迈向AGI的重大突破，引发了研发团队对AI安全的担忧，并直接引发了OpenAI董事会驱逐CEO Sam Altman、首席科学家llya出走等一系列重大事件。另外，也有人猜测草莓项目起源于OpenAI 2021年启动的GPT-Zero项目，类似谷歌AlphaZero的自主学习方向。吃瓜二，草莓大模型回答复杂推理问题需要十几秒甚至一分钟的时间，背后是自我反思机制，包括主动检查与改进，即对最终结果、也对推理步骤都进行反思迭代，这彻底突破了RLHF人类反馈AI改进的瓶颈，由模型替代人类监督评价自身推理过程，又称为“自举”机制，像人类科学家一样自我驱动持续钻研难题。2024年6月，OpenAI提出CriticGPT，配合人工能够有效检查出大语言模型的生成错误。同期，OpenAI提出了Prover-Verifier Games，构建了验证模型和推理模型的博弈框架。吃瓜三，2024年8月7日，OpenAI CEO Sam Altman在X社交媒体上发布了一章草莓照片，暗示草莓项目（o1模型）即将发布，引发一系列传言和猜想。在OpenAI定义的5级AGI体系中，草莓项目是L2级AI“推理者”的关键一步，能够解决博士水平的基本问题，其后3级分别是L3具有行动力的智能体、L4擅用创新力的创新者、L5组织工作效能的智能组织体。吃瓜四，草莓项目o1模型，为下一代基础模型生成高质量合成数据，减少幻觉。OpenAI下一代大模型不叫“GPT-5”，而是称为“猎户座Orin”，具有文本、图像、声音、视频等多模态数据的理解、推理能力，更自然地与人类、与环境交互，预计猎户座大模型将于11月大选后发布。吃瓜五，草莓o1模型具有可泛化的复杂推理能力。包括常识推理、数学推理、搜索推理评价反思能力，可以泛化到化学、物理推理任务中。人类的通用推理能力与记忆力无关，尺度定律驱动大模型参数量变大，带来语言大模型更善于记忆，而草莓o1新型推理大模型善于严谨思维，正在走出不同于尺度定律的工程化创新路径。此外，草莓o1善于利用代码解释器、多智能体反馈等工具，拓展自己的能力边界。吃瓜六，AI展现了自我进化能力的“先兆”，AI的思维链CoT越变越长，代表着思考推理过程的复杂化、深度化。凭借推理技能，草莓o1模型能通过小规模语料，自主发现学习、反思改进搜索、探索新策略、借用外部工具校验准确性，从而更好地适应环境，推动多智能体协同演化，颇有达尔文“物种进化”理论的变种，这方面的进一步思考请看《田丰说》“解密草莓”系列的“下集”。关注《田丰说》，每天3分钟，掌握全球AI大事件,本视频由商汤“如影”数字人APP生成。家人们的点赞、收藏、分享，是对田老师录课的最大支持！

3分钟

92

1年前