田丰说 - 第144集 Mistral、Meta开源模型“双王争霸”! - EarsOnMe

主播

节目简介

来源：小宇宙

关注《田丰说》，每天3分钟，掌握全球AI大事件！本视频由商汤“如影”数字人APP生成。

田老师认为，伴随美国Meta、法国Mistral两家企业在开源基础模型上的持续研发投入，开源大模型迎来了反超闭源大模型的一波浪潮，虽然部分开源模型的商业化落地需要原厂License许可，开源是一种开发者友好型的生态战略，并不代表完全自由的免费商用。中国超过20亿的物联终端，应提前考虑国产化小模型的落地规划，7月商汤推出了“日日新5.5”端云一体模型，每台终端设备的包年使用成本最低仅需9.9元。

全球AI要闻，Mistral AI公司推出123B开源大模型，硬刚Meta刚发布的Llama 3.1。

2天内，世界就有了2个GPT-4水平以上的开源大模型发布。法国AI创企Mistral AI升级开源竞争，7月25日发布了下一代AI产品：MistralLarge 2开源大模型，123B代表1230亿参数量，拥有128K上下文，支持包括中文在内的11种语言，以及80多种编程语言。虽然参数量低于Meta Llama 3.1的405B 4050亿参数量，但实测得分二者性能接近，可用于单个H100 节点。Mistal Large 2大模型提供了开放的权重，允许第三方根据需求对模型进行调整，自行部署必须提前获取Mistral AI 商业许可证。AI搜索独角兽PerplexityCEO说：“当前趋势很明显，大家把赌注押在小型开源模型、提炼和微调、服务和数据收集上。一两个前沿的闭源模型仍有价值，但不是全部。”

亮点1，Mistral AI 基于Codestral 22B和Mamba的经验，在很大一部分代码基础上训练了Mistral Large 2。研发团队投入大量精力增强模型的推理能力，重点之一就是尽量减少模型产生幻觉，或产生合理但实际上不相关信息的倾向。

亮点2，与上一代Mistral Large1模型相比，Large 2模型在对齐和指令功能上投入了更多精力。在WildBench、ArenaHard 和 MT Bench评测题库上，Large 2表现与全球最佳模型相当，同时冗长程度明显降低。

亮点3，Mistral Large2模型配备了增强的函数调用和检索技能，Function Calling单项能力在实测中，Large2得分超过GPT-4o，能够完成执行任务和顺序函数调用，成为复杂业务应用程序的强大引擎。

每天3分钟，掌握全球AI大事件！《田丰说》全网发布，敬请关注！

第144集 Mistral、Meta开源模型“双王争霸”!

加入我们的 Discord

扫描微信二维码

播放列表