在人工智能的激烈赛道上,一夜之间,DeepSeek 成为众人瞩目的焦点,其光芒盖过了众多国产大模型。过去一年,无论是 C 端表现出色的 Kimi、后来居上的豆包,还是用户日活早早突破 2 亿的文心一言,乃至登顶全球开源第一的通义千问,在 DeepSeek 引发的全球科技圈震动面前,都显得有些黯淡。这并非其他国产大模型不够出色,而是 DeepSeek 的表现太过惊艳。

此前,国内大厂一直探讨与 OpenAI 的差距,然而 DeepSeek 出现后,情况发生了转变。如今市场热议的是 DeepSeek 是否超越了 OpenAI,其开源路线甚至让 OpenAI 的 CEO 山姆・奥尔特曼反思,考虑调整开源策略。DeepSeek 在 C 端市场同样成绩斐然,上线仅 20 天,日活就突破 2000 万大关,成为全球增速最快的 AI 应用。对比之下,ChatGPT 突破 1500 万日活花了 244 天,而 DeepSeek 达到这一数字仅用了 18 天。上线 20 天后,DeepSeek 日活达到 2215 万,是 ChatGPT 日活用户的 41.6%,也超过了豆包的 1695 万日活用户。这一场由中国创业公司主导的 AI 风暴,来势汹汹。
人们不禁要问,为什么是 DeepSeek 取得了这样的成绩?毕竟过去两年,国内主流互联网大厂在大模型赛道投入巨大,也推出了不少产品,市场曾对它们寄予厚望,期待能与硅谷 AI 一争高下。但最终实现破局的却是 DeepSeek。
DeepSeek 的成功并非偶然,是长期积累后的爆发。它由知名私募巨头幻方量化孕育而生,创始人为梁文锋。早在大学时期,梁文锋就坚信人工智能将改变世界,这一信念贯穿其创业历程。2015 年,梁文锋创办幻方,作为国内最早运用人工智能进行量化交易的公司,2016 年深度学习生成的交易仓位上线执行,2017 年全面应用深度学习技术交易。2018 年,幻方将 AI 确定为主要发展方向,2019 年成立幻方 AI,专注大规模深度学习基础研究与应用。
从 2019 年到 2021 年,幻方先后研发 “萤火一号” 与 “萤火二号” AI 集群,“萤火二号” 投资达 10 亿元,大幅提升了算力。在此期间,幻方积极招募算法科学家,梁文锋本人也投身代码编写工作。到 2023 年 ChatGPT 出现时,幻方已储备超过 1 万张 A100 芯片,在云算力端,除了几家互联网大厂,幻方的芯片储备量相当可观,其对 AI 的投入丝毫不输大厂。
以梁文锋为代表的 DeepSeek 创业团队的创新锐气,也是其成功的关键因素。互联网大厂的 AI 战略常与现有业务紧密结合,腾讯的 AI 服务于社交和游戏生态,阿里的 AI 融入电商和云计算场景。这种业务协同虽然能快速实现商业化,但限制了技术的创新发展,资源投入越多,越倾向于优化现有模式,难以开拓新的技术路径。
而 DeepSeek 背靠幻方,有雄厚的财力支持,且创业团队敢于 “从零开始”,不惧失败。梁文锋坚定地追求创新,他认为中国 AI 不能永远处于跟随地位,要走到技术前沿推动生态发展。在实现创新的过程中,DeepSeek 采用了反套路的方式。
在团队组建方面,国内大厂进入大模型赛道时,往往选择从海外挖掘技术大牛,快速搭建团队。而 DeepSeek 团队大多由国内顶尖高校的应届毕业生组成,选拔标准注重热爱和好奇心,而非经验资历。在工作机制上,DeepSeek 不预设分工,而是自然分工。员工带着自己的想法工作,遇到问题会自发交流讨论。一旦某个想法展现潜力,团队会自上而下调配资源。在这里,员工可以随时调用训练集群的计算资源,且能灵活与他人协作,不受层级和部门限制。相比之下,大厂的组织架构像一台精密的 “效率机器”,而颠覆性创新往往需要突破常规,DeepSeek 做到了这一点。
当 AI 蓝媒汇就大厂未做出 DeepSeek 级产品的原因向 DeepSeek 提问时,得到的答案是组织惯性、商业化压力与技术路径共同作用的结果。这场由开源模型引发的技术革命,正促使大厂重新审视创新逻辑。如果大厂不能跳出固有框架,技术话语权可能会进一步被削弱。
展望未来,大厂若想在 AI 领域突破,需要重构创新机制,设立类似 Google DeepMind 的独立研发单元,容忍长期投入和失败风险;拥抱开源生态,通过开放协作提升数据与算法效率;优化资源分配,联合攻克国产算力瓶颈,推动跨行业数据合规共享;重新定义云服务价值,从单纯的算力供应商转变为 “AI + 云 + 行业” 的全栈服务商,避免陷入低毛利困境。

空空如也
暂无小宇宙热门评论