“基模五强”之外,MiniMax们正伺机而动
不知从什么时候起,AI大模型赛道的新闻中“六小龙”“基模五虎”这类名词被流行起来,不断“极简化”概括行业发展的现状。
人工智能赛道是未来商业的核心赛道,这是人们的共识,从马斯克到扎克伯格,从雷军到马云,几乎所有的前沿领域“大人物”无不秉持这个观点。
但行业发展的脚步不可能如一些撰稿人预测那般“稳步发展”,大模型和电商等传统互联网赛道的发展模式也不尽相同。
在传统以电商、社交媒体为代表的互联网赛道,企业做的是“范式升级”——将人们生活中本已稀松平常的生活场景(如找信息、社交、购物、吃快餐等)互联网化,力求帮助人们节约时间或者金钱,提高体验感。
这种商业模式需要大量的资本投入,需要新的平台载体(如微信、APP),以及一定的技术实力。但从本质上讲,还是原有场景的范式升级,并不是重新创造一种新的生活方式。
而在AI领域,从OpenAI石破天惊的o1将大语言模型展现在世人面前,到DeepSeek R1横空出世,以“轻量化”思维,追求大语言模型的极致推理能力,并以开源模式打破一切“固有流量垄断”,都在书写人们生活的新方式。
再简单点讲,传统互联网企业做的是从1分到100分的升级,而AI新秀则是要找寻从0分到100分的“无中生有”。别小看了这“0”和“1”之间差别,背后的发展模式和形态是大不相同的:
一是“0”到“1”的门槛未必那么高。当前还默默无名的小AI企业,一旦在某个小领域获得了突破,让人们忽然发现“原来还能这么玩”,那么很快就能成为颠覆性力量而崛起。
二是大模型的技术升级路径不再单纯依靠资本重金投入,而是可以从算法角度突破想象力空间,以优化方案(如MoE架构、各类蒸馏技术),以小博大,获得暂时的领先。
三是商业模式和应用场景异常多元。开源模式的畅销全球,打破了旧互联网思维下以“流量”定乾坤的逻辑,用创新性应用和极为便利和低成本的API调用,突破了资本和历史积淀所构成的厚重护城河。
在看待行业发展上,如果还是用老的互联网思维,去构建所谓的“电商四巨头”“互联网两极”,很容易跟不上行业发展的脚步。因为一些看起来可能并不显眼的“隐藏独角兽”,很可能会在一夜之间改变整个行业的格局。
MiniMax的启示
最新的例子是一家叫做MiniMax的AI企业,其并不位列当前最热的“基模五虎”之中,但推出了性能不输老牌大厂的一系列AI模型。
从今年6月中下旬开始,MiniMax连续几日接连推出了包含全球首个开源大规模混合架构的推理模型MiniMax-M1在内的“自研”AI模型应用矩阵,其中还包括视频生成模型Hailuo 02、通用智能体MiniMax Agent、视频创作智能体Hailuo Video Agent,以及音色设计工具Voice Design。
“自研”这两个字比较重要,对于创立于2022年的企业来说,能在2025年6月就斩获各项评分都不逊色于当前全世界主流模型的产品,实属难得。虽然背后一定是人才和资本的堆积效应,但还是和前文的观点一致,没有模型和算法本身的创新是不可能达成的。
比如,在M1模型中,公司独创了一种被称为“以闪电注意力机制为主”的混合架构,从而帮助该模型在计算长上下文输入以及深度推理的时候显著高效。此外,公司还提出了更快的强化学习算法CISPO,通过裁剪重要性采样权重(而非传统token更新)提升强化学习效率。上述两项算法创新,让公司M1模型实际上的整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。这比一开始的预期少了一个数量级。
结果是,M1支持100万上下文的输入,以及业内最长的8万Token的推理输出,可媲美谷歌最新闭源模型Gemini2.5Pro。整体测评实力在权威评测榜单中位列全球前列。
长文本处理一向是很多大模型的痛点,很多人在使用过程中不得不把一份大文档或者一篇大稿分成好多小篇幅文件进行处理,而M1模型至少在这个痛点上面,有了比较大的突破。
还比如,视频生成大模型Hailuo 02是当前全球唯一可以生成类似体操这种高度复杂的场景的模型,其背后是一种叫做“Noise-aware Compute Redistribution(NCR)”的核心架构。该架构可在同等的参数量级下,使训练和推理效率提升2.5倍,从而让该模型能够在不增加成本情况下,采用更大参数规模,增加表现力。结合上一代产品较火热的使用情况所带来的更大数据量,让该模型可以更好实现复杂指令遵循和复杂物理表现。
AI生成视频最大痛点可能就是所生成视频的高复杂动态会有缺失或者不真实感,此外高清视频的生成价格也是另一大痛点。显然MiniMax的这款新模型在着力满足用户的上述需求。
综合来看,在没有微软、谷歌等传统大厂的强大资金实力的背景下,MiniMax通过算法-模型方面的自主创新,以小博大,至少在2025年6月这个时间点上,取得了不俗的成绩。这再次提醒人们,AI赛道的爆发,有时候就在顷刻间,而爆发的主体则也很可能是一些“不起眼”但坚持自研的中小独角兽企业。
生态土壤是关键
作为一家高新技术企业,光有“坚持自研基础大模型”的勇气还不够,MiniMax这类企业能够有爆发的前提,还是要有合适的生态土壤和资本支持。
据外媒报道,总部在上海的MiniMax当前的估值大约30亿美元,并可能最早在今年追求去香港IPO。
据报道,去年MiniMax曾被估值超25亿美元,并新融资约6亿美元。该轮融资由阿里巴巴领投,此前已有投资的腾讯、红杉中国等机构也进行了跟投。
到目前为止,MiniMax官方还未回应有关IPO的报道。
以上可见,当前的互联网巨头并没有忽视包括MiniMax在内的AI潜力明星,即便阿里和腾讯都有自己的大模型,也都重金投入自研模型,但对外的投资表明,市场竞争依然还是相对公平的,AI超强“独断”的时代远未到来。
比较明显逻辑就是,MiniMax同时接受包括阿里和腾讯在内的巨头投资,就预示着其自主前进的战略不会受某一家单一巨头的显著影响。这就好比企业将鸡蛋放在了多个篮子里,从而避免被某一个篮子摆布、甚至吞并的结局。
MiniMax们的创业团队现在看到的,可能正是本文开头所讲的AI赛道和传统互联网行业的巨大差别,他们还不是餐桌上的“盘中餐”,而是正可以伺机而动,随时“发难”,自己成为坐上餐桌的那个“贵宾”。AI赛道的混战还远未结束。
另一方面,国家队的支持也是MiniMax们能有这份勇气的最好助力。
去年夏天,规模为225亿元的上海国投先导人工智能私募投资基金合伙企业(有限合伙)(“上海人工智能母基金”)正式落地徐汇区。该基金的主要管理方为上海国有资本投资有限公司,是妥妥的“国家队”。据报道,该基金将围绕人工智能上下游产业,聚焦智能芯片、智能软件、自动驾驶、智能机器人等人工智能相关领域,强化人工智能相关产业链集聚,推动与支持上海人工智能先导产业创新发展。
这些基金“国家队”能为像MiniMax这样有技术基础、敢于创新、敢于较劲、敢于坐上餐桌的中小AI企业,提供重要的资本保障。
在上海“关于人工智能“模塑申城”的实施方案”中,明确要加速通用和专用大模型融合创新,打造一批行业基座大模型。支持行业企业做强基础大模型(L0)和开源生态,推动强化学习、指令微调、思维链等技术创新应用。加快培育一批融合行业数据集的行业基座大模型(L1),鼓励知识蒸馏、剪枝、量化、参数共享等技术研发。围绕场景应用大模型(L2)和智能体研发应用,培育一批行业应用开发商和集成商,鼓励企业搭建模型即服务平台,促进大模型落地应用。
从顶层设计上,政府也为基础大模型企业的后续发展提供了支持保障。
空空如也
暂无小宇宙热门评论