Album
时长:
3分钟
播放:
6
发布:
1年前
主播...
简介...
https://xiaoyuzhoufm.com

关注《田丰说》,每天3分钟,掌握全球AI大事件!本视频由商汤“如影”数字人APP生成。


田老师认为,伴随美国Meta、法国Mistral两家企业在开源基础模型上的持续研发投入,开源大模型迎来了反超闭源大模型的一波浪潮,虽然部分开源模型的商业化落地需要原厂License许可,开源是一种开发者友好型的生态战略,并不代表完全自由的免费商用。中国超过20亿的物联终端,应提前考虑国产化小模型的落地规划,7月商汤推出了“日日新5.5”端云一体模型,每台终端设备的包年使用成本最低仅需9.9元。


全球AI要闻,Mistral AI公司推出123B开源大模型,硬刚Meta刚发布的Llama 3.1。


2天内,世界就有了2个GPT-4水平以上的开源大模型发布。法国AI创企Mistral AI升级开源竞争,7月25日发布了下一代AI产品:MistralLarge 2开源大模型,123B代表1230亿参数量,拥有128K上下文,支持包括中文在内的11种语言,以及80多种编程语言。虽然参数量低于Meta Llama 3.1的405B 4050亿参数量,但实测得分二者性能接近,可用于单个H100 节点。Mistal Large 2大模型提供了开放的权重,允许第三方根据需求对模型进行调整,自行部署必须提前获取Mistral AI 商业许可证。AI搜索独角兽PerplexityCEO说:“当前趋势很明显,大家把赌注押在小型开源模型、提炼和微调、服务和数据收集上。一两个前沿的闭源模型仍有价值,但不是全部。”


亮点1,Mistral AI 基于Codestral 22B和Mamba的经验,在很大一部分代码基础上训练了Mistral Large 2。研发团队投入大量精力增强模型的推理能力,重点之一就是尽量减少模型产生幻觉,或产生合理但实际上不相关信息的倾向。


亮点2,与上一代Mistral Large1模型相比,Large 2模型在对齐和指令功能上投入了更多精力。在WildBench、ArenaHard 和 MT Bench评测题库 上,Large 2表现与全球最佳模型相当,同时冗长程度明显降低。


亮点3,Mistral Large2模型配备了增强的函数调用和检索技能,Function Calling单项能力在实测中,Large2得分超过GPT-4o,能够完成执行任务和顺序函数调用,成为复杂业务应用程序的强大引擎。


每天3分钟,掌握全球AI大事件!《田丰说》全网发布,敬请关注!

评价...

空空如也

小宇宙热门评论...

暂无小宇宙热门评论

EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧