梁文峰,好样的!
AI 进化论

梁文峰,好样的!

8分钟 63 1天前
节目简介
来源:小宇宙
它不是第一,但改变了游戏规则
00:01
今天我们要聊的是一个人工智能模型。它通过坦诚的去面对自己的短板,重写了底层的代码,以及用一个极低的价格来试图让大家看到在人工智能的领域里面,公信力、工程能力和普惠的价值。
00:24
没错,这个话题最近真的很火,那我们就直接进入今天的讨论。
00:28
首先我们要聊的就是DeepSeek V4这个模型。他最近公开承认自己在某些方面是不如Claude Opus4.6,这个事情在AI圈里面真的是掀起了一些波澜。
00:41
对,这个事情发生在4月24号DeepSeek V4发布的时候,他们就是很罕见的在自己的官方文档里面写,说我们这个模型确实在某些方面是不如人家Claude Opus4.6的。这个就跟现在大部分的公司都是在发布会上面各种王婆卖瓜子卖自夸完全不一样。所以大家就觉得很新鲜。
01:03
所以说DeepSeek这种承认自己不足的做法,是真的会让用户更信任他们吗?
01:08
会的,因为现在大家已经被各种AI公司的我最牛逼这种宣传已经轰炸到麻木了。那这个时候DeepSeek他主动的说出我哪里不行,反而让用户觉得这个数据是真实的,他是可信的当这个公司都愿意公开自己的短板的时候,大家就会更容易相信他说我很擅长这个事情的时候,那他一定是真的很擅长。
V4到底有多强
01:31
明白了,DeepSeek V4到底在哪些具体的能力上面是比较突出的。
01:35
比如V4 pro它的编程能力也是要比Claude Sonnet4.5 强的对然后它的agent智能体能力在国内的开源的模型里面是遥遥领先的。还有它的上下文长度是支持到100万字的。你可以把一整本红楼梦喂给他,然后让他来分析贾宝玉的内心变化。就是他的这些能力都是实实在在可以用在各种场景里面的这是他真正的底OK。
华为昇腾是啥?为什么这么重要?
02:00
紧接着我们要说的就是DeepSeek V4,它为什么要放弃英伟达的CUDA,然后要自己去适配华为的升腾芯片和CANN平台,这个里面到底有哪些技术上面的挑战?
02:13
其实DeepSeek V4它是第一个完全跑在华为昇腾芯片上的大模型。以前几乎所有的AI模型都是要依赖英伟达的CUDA平台的,相当于大家都在同一条公路上跑。DeepSeek V4这次就是把这条现成的公路给扔了,然后自己重新修了一条路。工程师们几乎把所有的核心代码都重写了一遍,才让这个模型可以跑在CANN上面。
02:36
这个难度就像是把一个本来专门为PS5开发的顶级3A游戏,移植到一个全新的国产游戏机上面。而且还要把游戏引擎的底层全部都重写一遍。但是最终还要保证两边的画质和流畅度几乎没有差别。
02:52
而且他们还真的就做到了。这不仅仅是证明了他们的技术实力,也让大家看到了原来AI模型的这个生态是可以不依赖于国外的这些硬件和软件的。
03:03
这么说的话,DeepSeek V4现在的这个性能主要的瓶颈是在硬件的产能上面,而不是在算法或者说适配上面。
03:11
是的,他们其实也在官网上面明说了,就是因为现在高端算力的限制,所以吞吐量还上不去。但是等到今年下半年昇腾950的超节点大规模的上市之后,这个问题就会解决。所以现在的问题其实是一个硬件产能的问题,而不是说他们的软件或者说算法没有做好。
03:32
这是不是说明只要硬件的产能跟上来了,DeepSeek V4就可以马上释放出更强的性能。
03:38
没错,就是他们已经把所有的技术难题都解决了,相当于把路已经修好了,现在就等更多的车跑上来。所以只要硬件的产能跟上来了,他们的这个性能提升是会非常明显的。
它便宜吗?
03:51
我有一个疑问,DeepSeek V4为什么可以把价格定的这么低?
03:56
它的V4 pro版本的价格是每100万token只需要一块钱人民币,而这个价格只是GPT5API的20分之1。就是它的价格低到你都觉得有点不可思议。
04:07
确实不可思议。这个价格几乎是把整个行业的门槛都拉到了地板上。
04:12
没错,这就会让开发者的成本大幅的降低,所以大家就可以更无压力的去尝试更多的创新,整个行业的生态也会因为这个而变得更加活跃。
04:23
所以DeepSeek 他现在这么激进的定价背后到底是在打什么算盘?
04:27
他们其实并不是想要短期的去赚快钱,而是希望通过这种极低的价格,把大模型变成像水电一样的社会基础资源。然后让尽可能多的用户和开发者都来使用他们的这个平台,形成一个非常强大的生态,让大家都离不开他们。
04:45
说到这儿,咱们再来说一下DeepSeek这家公司的精神内核,以及他们是怎么面对外界的质疑的。为什么这家公司可以做出承认自己的短板,重写底层的代码和发动价格战这样完全不走寻常路的事情?
05:01
其实这都来源于他们非常硬核的企业文化。在他们的发布会快要结束的时候,他们的创始人还特意引用了荀子的一句话,不诱于誉,不恐于诽,率道而行,端然正己。就是他不会被外界的一些称赞或者说一些非议所影响,他只会按照自己的理想和原则去走自己的路。
05:23
原来是这样。在DeepSeek V4发布之前,外界对于他们的质疑也很多,那他们面对这些声音是怎么回应的?
05:31
在发布会前的几个月,外界各种流言蜚语都有。比如说他们的项目要跳票了,比如说他们的团队已经散了,还有一些人在捧他们说他们要一鸣惊人,但是他们整个团队没有回应任何的外界声音,就只是专心的把V4版在昇腾芯片上跑通了。然后最后用不诱于誉,不恐于诽,率道而行,端然正己这16个字来作为对所有争议的回应。
06:00
所以DeepSeek这种只专注于做技术,然后完全不跟外界做这种无谓的争论的这种风格,在AI行业里面是不是特别少见?
06:07
是,现在大部分的公司开发布会都是搞得很炫,然后各种新的功能吹得满天飞。但是DeepSeek他就像一个在深山里面练功的武僧一样,他就只专注于扎马步练内功,就完全不参加这种花里胡哨的社团活动。
为什么V4值得被记住?
06:23
最后我们来总结一下,DeepSeek V4它的出现到底在哪些方面重新定义了AI行业的价值标准。
06:30
DeepSeek V4它让大家看到了在这个真假难辨的行业环境里面,敢于承认自己的短板,其实是一种非常稀缺的公信力。而这种公信力其实已经变成了一种顶级的价值。
06:45
是的,那DeepSeek V4这种专注于工程实现和低价策略,会给这个行业带来哪些深远的影响?
06:50
首先他们放弃了现成的技术路线,然后自己去构建了这种软硬一体的闭环,这个是非常难以复制的。所以这就是他们真正的护城河。同时他们通过极低的价格,把AI从一个高端的玩具变成了一个工业化的工具。那这个时候所有闭源的大厂都不得不去重新思考自己的商业模式。
07:11
DeepSeek V4的出现是不是意味着这未来的AI会越来越像一种基础设施?
07:17
没错,就是AI它最终会褪去所有的神秘的光环,然后变成像水电一样的东西。它很便宜,然后无处不在,但是它又很枯燥。它不再是一个什么很科幻的东西,而是一个你每天都要用到的东西。
07:32
那是不是意味着未来只有那些能够把AI的成本压到最低的公司才能活下来?
07:37
是的,因为最后拼到极致的话,就是谁能够把每一比特的算力都榨出最大的价值,那这些公司才能够在这个市场上生存下去。未来拼的不再是说谁最聪明,而是谁最能够坚持长期的投入,然后把效率做到极致。
07:54
OK了。今天我们跟大家聊了DeepSeek V4,它是如何通过坦诚能和技术创新以及极低的价格,把AI变成了一个更可信更普惠的工具。然后也让我们看到了这个行业未来的新的方向。
08:09
好的,今天的内容咱们就到这里了,然后感谢大家的收听,咱们下期再见,拜拜。

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧