田丰说 - 节目列表

第134集 Gartner预测：2027年模型价格下降99%！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，AI为软件业带来变革，而每一次软件业创新都会给全人类带来翻天覆地、突破想象的巨大变化，尤其是当技术成本飞速下降时，中国14亿人的创新能力、工程能力都被释放出来，未来三年我们将看到如雨后春笋般加速生长的AI2.0应用，低成本的AI服务是打开全民新质生产力的钥匙。全球AI要闻，大模型价格战加速AI向云端迁移。 Gartner最新分析报告指出，大模型API的降价对企业级市场的短期影响非常有限，产生的变化是推动众多企业将生成式AI应用从内部机房私有化部署转向AI云端，因为云侧大模型API的价格正在持续下降，况且大模型云部署能提供灵活性、创新速度、开发生态系统。值得注意的是，AI模型价格只是市场评估因素之一，客户还需要考虑服务质量、吞吐量、延迟性能等其他关键因素。预计到2027年，中国基于AI云的人工智能推理算力负载，将从现在的20%上升到80%。大模型API服务平均价格将继续下降，在保持相同质量、吞吐量和延迟水平的情况下，模型平均价格将低于当前均价的1%，即下降99%。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

19

第133集 Mistral Nemo、英伟达，开源12B“小模型”！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，正如当年Windows、安卓操作系统的市场普及，算力门槛更低、智能水平够用的小模型将在未来2到3年，迅速席卷消费电子、互联网应用、传统软件市场，带来AI硬件换代潮、软件AI升级潮，这就是为什么Mistral小模型选择和英伟达合作的原因，英伟达希望通过小模型+终端芯片抢占消费电子市场份额。国内AI产业异曲同工，商汤科技将“日日新5o”模型接入智能台灯，让所有青少年、成年人拥有了一部“会说话”的AI万能百科全书、一位贴心的AI学科辅导老师。全球AI要闻， Mistral联合英伟达开源12B小模型。 7月19日，MistralAI官宣和英伟达联合打造，参数量为12B（120亿）的开源小模型Mistral NeMo，上下文窗口是128k，推理能力、编码准确性在同类产品中都是SOTA最优级别。由于Mistral NeMo依赖于标准架构，因此更易于使用，能在任何使用Mistral 7B的系统中成为替代品。 NeMo模型专为全球多语言应用而设计，包括中文、日语、韩语、阿拉伯语等表现尤为突出。NeMo使用基于Tiktoken的新分词器Tekken，与Llama 3分词器相比，在压缩所有语言中大约85%的文本内容更胜一筹。该模型的效率和本地部署能力适合笔记本、台式电脑。英伟达和Mistral AI正在通过小模型解决数据隐私、延迟等本地处理问题。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

10

第132集 GPT-4o mini，开启“小模型”竞赛！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，AI原生公司商业化加速，从比拼“越大越强”的基础模型，转向比拼“小而优”物美价廉的小模型，世界移动终端、软件应用将被无数小模型占领，企业级客户、C端客户喜爱“既聪明又便宜”的AI模型服务。 7月商汤科技在世界人工智能大会上，公布了具有环境感知能力、语音对话能力的“日日新5o”模型，并带来了惊喜价格，单设备使用AI一年9.9元。商汤科技董事长兼CEO徐立博士说：“要让每个人都能用上AI大模型，就必须让更多终端都能接入大模型。因为终端上的计算是分布式的，而不是集中化的。” 全球AI要闻，Sam Altman认为，通往智能的成本忽略不计了。 7月19日凌晨，OpenAI发布GPT-4o mini，是目前硅谷最具成本效益的小模型，让智能服务更加经济实惠，大大扩展了利用人工智能构建的应用范围。GPT-4o mini在国际基准测评MMLU排行榜上得分率为82%，每百万输入token的价格是15美分，约1.12元人民币，每百万输出token的价格是60美分，约4.32元人民币，比自家GPT-3.5Turbo便宜60%以上，也比竞争对手Claude 3 Haiku和谷歌Gemini Flash要便宜40%至60%。Sam Altman评价说：“两年前，世界上最好的模型还是GPT-3的text-davinci-003版本，与今天相比表现差得多，还要贵上100倍。通往智能的成本已经低到可以忽略不计。” 亮点1，在OpenAI的设想中，未来模型将无缝集成到每一个应用程序和网站中。GPT-4o mini为开发人员铺平了道路，更经济地构建和扩展AI应用。亮点2，过去的一周，GPT-4o mini早期版本在大语言模型竞技场Arena进行测试，用户投票超过6000人次，成绩赶超GPT-4-Turbo性能。GPT-4o mini即日起向ChatGPT用户开放，计划在未来几天内向市场推出微调功能。亮点3， GPT-4o mini是第一个应用“指令分层”方法的模型，有效提高模型抵御越狱、提示注入和系统提示提取等安全能力。亮点4，OpenAI在博客附上了9名团队负责人名单，有5位是华人面孔，清华、北大、同济校友均在列，其中加入公司最长的一位科学家在岗时间是4年。本周四，花旗发布报告公布，继Google、Meta、字节跳动后，OpenAI将成为博通的第四大ASIC定制芯片客户，预计博通将在2025年下半年后交付芯片。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

3分钟

7

第131集 Anthropic新基金，催化大模型应用生态！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，大模型应用生态是基础模型的关键产业路径，通过投资基金方式批量孵化种子应用与种子用户群，十分高效。OpenAI设立了1.75亿美元的Startup Fund基金。另一方面，用AI技术来筛选市场上有潜力的投资标的，正在成为世界级投资基金携手基础大模型公司的目的之一。全球AI要闻， Anthropic创立1亿美元投资基金，拓展应用生态。 7月18日，Anthropic公司宣布与最大投资者之一的 Menlo Ventures 联手设立一项名为Anthology Fund的1亿美元基金，用于投资种子期A轮的AI初创公司。据悉，Menlo最近完成了对Anthropic基础模型公司逾7.5亿美元的一轮未公布融资。双方为进一步了解 AI前沿生态系统，挖掘在Anthropic等AI基础模型上更广泛发展的优秀公司。Anthology Fund 基金将向初创企业开出起价10万美元的支票，并为他们提供价值25000美元的信用额度，用来免费使用Anthropic模型。Menlo将使用该公司的专有机器学习工具对线上申请进行评分和排名，对这些公司的尽职调查过程预计将比该公司的典型投资更“轻松”。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

10

第130集 AutoGPT智能体，学会“组队”了！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，多个智能体协同技术成为基础科研、产业应用重点，涉及角色互补、沟通协同、责任分工、质检改进等重要工作方法，其中智能体间的有效通信、指令跟随成为关键能力，如果AI无法像人一样丝滑交流则事倍功半，反之则能持续提升群体智能的新质生产力。全球AI要闻，AutoGPT进阶版来了，定制多智能体协同。 7月18日，全球爆火的AutoGPT智能体项目作者在X社媒上宣布了下一代版本，目前是 Pre-alpha 版本。与前代相比，新版本让构建、运行、共享AI智能体变得比以往任何时候都更容易，同时智能体的可靠性也大大提升。该项目具有以下两个主要组件，分别是后端的 AutoGPT Server 和前端的 AutoGPT Builder。其中后端 Server 负责创建复合多智能体系统，将 AutoGPT 智能体和其他非智能体组件用作原语。作者展示了如何使用下一代AutoGPT快速构建、部署、使用Reddit营销智能体，AI能够自动回复产品评论，执行其他复杂任务。AutoGPT项目还能自定义添加节点，手动编写新任务模块非常简单。作者发现，Claude模型通过创建自定义任务模块做得非常出色。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

11

第129集 OpenAI超级对齐，AI的“自我养成”！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，类似对抗神经网络原理，让AI给另一个AI挑错并改进，成为模仿人类“学习-实践-优化”循环的技术实现方法，之所以采用小模型作为验证器是因为其成本低、可行性高，对大模型有答案检验能力的小模型，正在逐渐演变为一种AI云端通用服务。全球AI要闻，OpenAI超级对齐成果：小大模型博弈输出。 7月18日凌晨，OpenAI在官网发布超级对齐研究成果，由于神经网络的复杂性和多变性，无法验证其生成内容的准确性，出现 “黑盒”问题。为了解决该难题，OpenAI提出了全新训练框架Prover-Verifier Games（PVG），例如，用GPT-3这样的小模型来验证、监督GPT-4大模型的输出，从而提升输出准确率、可控性。论文作者之一、OpenAI研究员Yining Chen表示，这种方法“有可能使未来的模型比人类更聪明”。亮点1，PVG模块的核心思想是通过多轮迭代训练，来提升AI证明者和AI验证者的整体性能。在每一轮训练中，验证者模型首先使用监督学习来预测从之前轮次的证明者模型中采样的内容正确性。亮点2，在多轮训练中将人类偏好引入了验证器，千分之一到百分之一的效果最佳，其鲁棒性也逐渐增强，能够更准确地识别出错误答案。亮点3，在验证的过程中，证明者和验证者的角色相互依赖。证明者模型需要生成能够说服验证者模型的内容，而验证者模型则需要具备足够的判断力来识别出正确内容，OpenAI力图实现准确性和易读性的平衡。亮点4，在训练过程中，还引入了一种名为可检查性训练，通过交替训练验证者和证明者模型，从而验证使用监督学习来预测从之前轮次的证明者中采样的解决方案的正确性。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

11

第128集商汤日日新大模型，助攻中国篮球队！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师很喜欢伟人说过的一句话：“欲文明其精神，先自野蛮其体魄；苟野蛮其体魄矣，则文明之精神随之。”体育科技不仅能让运动员的专业训练效率事半功倍，同样也能帮助全体国民畅享健康生活。全球AI要闻，商汤联手中国国家篮球队，AI大模型助力征战巴黎。商汤科技与中国国家篮球队达成战略合作，将基于日日新SenseNova5.5大模型技术共同打造AI大模型篮球产品，共同开发中国国家篮球队运动表现分析平台。通过构建场地三维模型，结合3D动作捕捉算法，商汤AI大模型篮球产品可实时解析场上所有球员的运动状态及篮球的运动轨迹，为教练团队提供详尽的数据支持，提升运动员的竞技水平。 7月15日，中国三人篮球国家队举行巴黎出征动员会，此前商汤AI大模型篮球产品已成功应用于中国三人篮球国家队征战的日常训练，辅助优化训练策略。未来，商汤科技将持续探索AI大模型技术在篮球及体育产业中的创新应用。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

9

第127集欧洲Mistral新模型，擅长数学题、写代码！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，AI已经在图像分类、阅读理解、视觉推理、语言理解等方面超过人类，下一步攻坚目标是需要复杂逻辑推理的数学与编程，善于推理的AI技术有可能在2年内取得突破。全球AI要闻， Mistral联手Mamba开源首款代码模型。 7月17日，Mistral发布了两款小模型，Mathstral 7B和Codestral Mamba 7B，都是70亿参数量。Mathstral7B针对STEM学科的数学分析，上下文窗口为32k，Codestral Mamba 7B是使用Mamba架构的代码模型。值得关注的是，代码模型是首批采用Mamba 2架构的开源模型之一。实测7B性能接近22BTransformer架构，最多256k token上下文长度，都可以调用官方发布的Mistral-finetune和Mistral Inference两个开源SDK，使用或微调模型。亮点1，Mathstral模型专为解决需要复杂、多步骤推理的高级数学问题，与战略合作伙伴共同研发，上周刚在Kaggle第一届AI奥数竞赛中得到冠军宝座的Numina。它可以正确回答“9.11和9.9哪个更大？”等难倒一众大模型的问题，答案是整数、小数分开比较，思维链非常清晰。亮点2，官方博客透露，Mathstral模型似乎牺牲了一些推理速度以换取模型性能，但基准测试中，Mathstral打败了Llama 3 8B、Gemma29B，在AMC 2023、AIME 2024这类数学竞赛题上达到了SOTA。亮点3，代码模型研发过程中，得到了Mamba原作者Albert Gu和TriDao的帮助，Codestral Mamba基本达到Code Llama 34B相匹配的效果，在其中6个测试上实现了性能超越。亮点4，不到两个月前，Mistral刚发布了代码模型Codestral 22B新模型，研发速度几乎按月迭代了。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

13

第126集微软“万能钥匙”，入侵GPT-4o！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，《矛盾论》告诉我们“有矛必有盾”、“有盾必有矛”，AI科技的攻防一直是动态变化的，AI万能钥匙的出现就会催生更安全的AI安全锁。全球AI要闻，微软发现“万能钥匙”，成功入侵GPT-4o等大模型。本周，微软Azure CTO MarkRussinovich分享了大模型入侵技术Skeleton Key（万能钥匙）。万能钥匙技术是一种越狱攻击AI的方法，核心原理是使用多轮强制、诱导策略使大模型的安全护栏完全失效，让AI回答一些禁止的答案，包括血腥、暴力、歧视、色情等非法内容。与先前的Crescendo攻击方法相反，万能钥匙直接修改模型的行为指导准则。例如，让ChatGPT回答，如何以更高效的方式进行盗窃并且不被人发现。原本模型是不允许回答这类非法内容的，但用万能钥匙攻击后，模型就会为你提供各种建议。微软万能钥匙成功入侵了包括GPT-4o、Gemini Pro等主流模型，展示了现有AI安防的不足，微软也帮他们修改了模型的安全护栏。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

12

第125集谷歌搜索4%，Hebbia将搜索96%？

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，企业私有数据检索并不是崭新的技术，但数据检索技术与大模型技术相融合，将让企业所有员工都能用自然语言“零代码”查询、分析数据，将极大提升生产力。全球AI要闻，Hebbia融资1.3亿美元，非结构数据服务被看好。 AI文档搜索公司Hebbia宣布完成1.3亿美元B轮融资，估值约7亿美元，投资方包括 a16z、GoogleVentures和Peter Thiel等，公司年度经常性收入为1300万美元，已经实现盈利，收入在1年半中增长了15倍。去年Hebbia就指出，聊天机器人只能解决简单问题，对企业复杂问题价值有限。尤其在高度依赖信息的特定领域，需要有特定的产品展示方式。 Hebbia重新设计了电子表格式界面，允许用户构建能够执行综合任务的AI代理。目前，Hebbia产品主要被应用在金融服务、法律领域，客户包括美国空军以及资产管理公司和法律服务公司。按Hebbia公司在官网自信地说：“我们拥有世界上最伟大的聊天机器人，Google仅索引了全球4%的数据，Hebbia正在释放其余96%的资源，使其成为知识工作者经济的中心平台。我们的使命是到2030年将强大的人工智能交付给10亿人。” 每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

9

第124集微软GraphRAG，打造“数据挖矿机”！

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。田老师认为，微软、谷歌、OpenAI都将数据技术的重点聚焦各大企业内部数据，而将庞杂繁复的企业级数据快速转化为高质量知识，让模型能够“消化”，成为GraphRAG等新技术研发的目标，谁能先研发出数据矿藏的“挖矿机”，就能优先赢得广大拥有行业数据企业家的拥抱。全球AI要闻，微软坚信GraphRAG是未来之路，开源社区星标上万。 7月，微软发布最强RAG知识库开源方案GraphRAG，上线即爆火，发布2周开源星标量高达1万。微软GraphRAG将向量囊括进来，不同于RAG仅基于文本嵌入之间的相似度，两种技术并不是竞争关系。 GraphRAG通过使用大语言模型生成知识图谱，能大幅提升检索水平，为上下文窗口填入相关性更高的内容，所需token数量能减少26%至97%。Data.world公司在43个业务问题上实践显示，GraphRAG将大语言模型响应准确度平均提升3倍。 Neo4j公司CTO Philip Rathle说：“你的下一个生成式AI应用很可能就会用上知识图谱。”Neo4j发布了一款开源工具NeoConverse，能通过自然语言来查询知识图谱。比如GraphRAG依托大语言模型的文本到图谱工作流程，将10000篇金融文章整理成了一个知识图谱，与 RAG相比，不仅能提升答案质量，答案的token数量也少了三分之一。每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

31