
或许多数人都难以想象,在 2025 年春节之际,大模型领域呈现出一片热闹非凡的景象。故事要追溯到十天之前,DeepSeek 正式开源了 DeepSeek - R1。这款模型在数学、代码以及自然语言推理等诸多任务上的表现,足以与 OpenAI o1 正式版分庭抗礼。此消息一出,众多 AI 研究者为之惊叹,大家纷纷展开思索,试图探寻其中的奥秘。与此同时,英伟达市值出现了幅度高达几千亿美元级别的波动,这一情况瞬间吸引了全球各界的目光。
围绕 DeepSeek 的技术创新,业内展开了广泛的探讨。不少人认为,DeepSeek 在硬件条件受到限制的情况下,另辟蹊径,走出了一条与 OpenAI 等单纯依靠堆叠算力截然不同的发展道路。它借助一系列先进的技术创新手段,不但有效降低了模型对算力的需求,而且还显著提升了模型的整体性能。
在被 DeepSeek 这一 “神秘的东方力量” 所震撼之后,硅谷方面的态度变得十分耐人寻味。从最初毫不吝啬的高度赞赏,到后来逐渐演变为网络攻击与审查行为,这种前后态度的巨大转变,充分体现出中国 AI 的崛起给大洋彼岸带来了强烈的冲击。
这不禁让人回忆起谷歌研究员在 2023 年做出的那个略显悲观的预估:“我们没有所谓的护城河,OpenAI 同样也没有。”
倘若我们进一步深入思考,就会发现,这份恐慌与焦虑的根源其实早已深深埋下,并非仅仅是由 DeepSeek 这一家公司所引发的。
当下,正是重新审视中国大模型发展态势的恰当时机,这其中涉及到的参与者众多,像文心一言、豆包、可灵等等都在其列。

国产大模型,如今已然实现全面崛起。
在过去两年的时间里,中国大模型凭借迅猛的发展势头,在多个垂直领域强势崛起,成功跨越了曾经横亘在前进道路上的重重障碍。
除了 DeepSeek 之外,文心一言所具备的 RAG 能力、可灵的文生视频技术以及豆包的语音生成功能等等,均已超越了美国的对标模型。
我们不妨先从视频生成领域的 “超越” 这一精彩篇章说起。2024 年春节期间,OpenAI 发布了 Sora,这一年也因此被视作视频生成技术蓬勃发展的爆发之年。然而,就在同年 6 月,可灵横空出世。它在文生视频技术的产品落地方面实现了实质性的领先,这一成果首次让硅谷方面清晰地认识到 “中国的 AI 技术具备独特的自身优势”。
由此,我们深刻意识到,中国或许无需再陷入重复 “追赶 OpenAI” 的漫长过程。而后续的发展进程也再次有力地验证了这一观点。
1、曾经 OpenAI 讳莫如深的「技术黑盒」,正在被逐一破解。
2、借助大量工程创新,国产大模型已经破除了对「英伟达 GPU」的迷信。
3、当中国 AI 的竞争对手开始在意、压制、攻击,折射出的是对方关于被追赶、超越的恐慌。
(部分资料源于网络)
本期主播:蛋酥酥/猫猫
后期:丹尼播客制作
制作人:蛋酥酥
录制支持:KUEENDOM
空空如也
暂无小宇宙热门评论