2026年,AI已经不是"未来"了——斯坦福最新报告,替你读完了
AI 进化论

2026年,AI已经不是"未来"了——斯坦福最新报告,替你读完了

10分钟 110 4天前
节目简介
来源:小宇宙
先说一个让你有点坐不住的数字
00:01
今天我们要聊的是人工智能在最近几年普及的速度特别快,然后它在各个领域都有一些非常厉害的表现。但是它也不是万能的,在有些地方还是有短板。
00:19
是的,这个话题确实是大家最近都非常关心的一个话题。那我们就直接开始。
00:23
咱们第一个话题就是这个生成式人工智能它的普及速度到底有多夸张,我们经常会拿它跟个人电脑和互联网普及的速度做对比。那到底这个对比的结果能够说明一个什么样的趋势?
00:37
2026年的斯坦福的AI报告里面提到说,生成式人工智能在全球的普及率达到53%只用了不到三年的时间。那你要知道个人电脑普及到这个程度用了将近20年,互联网普及到这个程度用了15年。所以就是说生成式AI的普及速度是远远超过过去的这些重大的技术变革的。它大概是5到10倍的一个速度差。
01:01
听起来就像是技术的进步在做火箭一样。这种速度是不是会彻底改变我们对技术扩散的传统认知?
01:08
对,因为它这种指数级的增长,就会让社会没有办法去慢慢的适应。所以它带来的就是各个行业的转型压力会剧增。然后也会让个人和企业都不得不重新去审视自己对AI的态度和策略。
第一件大事:AI正在变得"无聊"
01:23
然后紧接着我们要聊的一个话题就是现在这些头部的AI系统,它们之间的实力差距到底还有多大。
01:30
现在的格局其实已经非常接近了。就比如我们看这个斯坦福报告里面,它是用类似于国际象棋的Elo排名来给这些AI打分。你会发现比如像Anthropic的Claude系列是1503分,xAI的Grok是1495分, Google的Gemini是1494分,然后OpenAI的GPT是1481分。你看它们其实分差都在25分以内。
01:57
所以就是说我们作为普通用户,现在再再去挑选AI服务的时候,是不是就不用太纠结说哪个模型是绝对最强的。
02:05
没错,就是现在你可能花1000块钱买的AI和花500块钱买的AI其实在能力上没有什么本质的区别。所以以后可能AI公司就不会再去拼谁的模型更强,而是会去拼谁的价格更实惠,谁的响应速度更快,或者是谁更能满足你一些特定的需求。
第二件大事:中美AI差距,正式消失
02:22
我们接下来要谈的一个主题,就是中美在AI领域的差距变化。其实最近这个DeepSeek的出现,真的是让全球的科技圈都为之一振。那这个报告里面是怎么去描述这一轮新的竞争的?
02:37
这个报告里面说2023年的时候,美国还在AI领域大幅领先。但是到了2025年的二月份,随着DeepSeek一的发布,中国的这个模型就一下子冲到了和美国顶级模型几乎不分上下的位置。
02:53
这是不是意味着全球的AI格局已经进入了一个真正的双雄对决的新阶段?没错。
03:00
而且到2026年的三月,美国排名第一的模型也就只比中国排名第一的模型高了2.7%。然后更有意思的是,这两家的模型已经轮番的抢占过榜首的位置,大家其实是非常激烈的在竞争。
第三件大事:AI到底"聪明"在哪,又"蠢"在哪?
03:14
下面咱们具体说说AI的这种锯齿形智能。这个报告里面到底是怎么形容AI在不同任务上面表现的巨大差异的。
03:22
报告里面有一个特别生动的词叫做“锯齿形智能”。就是说AI的能力分布就像锯子一样,有些地方特别尖特别厉害,有些地方就特别低。比如像Google的Gemini它可以在国际数学奥林匹克竞赛拿金牌。然后它在博士级别的科学问答上面,它的正确率甚至超过了人类专家。而且在GitHub上面修复代码的问题,它的准确率也是一年之内从60%几乎提升到了100%。
03:50
听起来AI简直就是无所不能,但是我听说它们在一些很简单的事情上面反而会闹笑话。
03:55
对,比如让AI去看一个模拟时钟,人类的准确率是90%,但最强的AI准确率只有50%。而且AI一旦看错了,它的误差经常是1到3个小时,但是人可能就只错3分钟左右。所以你可以放心的让AI去帮你做一些数学难题,但是你千万不要指望它能够帮你看时间。
第四件大事:工作,真的在悄悄变少
04:17
换个角度我们来讨论一下这个AI对就业市场的冲击。最近大家都在关心这个问题,尤其是在软件开发行业,AI到底带来了哪些变化?
04:28
实际上报告里面的数据是非常直观的。就是说2024年开始,在软件开发行业里面,22到25岁的年轻程序员的就业人数下降了将近20%。但是30岁以上的程序员人数还在持续的上升。
04:44
所以这是不是意味着公司对于初级程序员的需求在锐减。
04:50
并不是说不需要程序员了,而是说那些入门级的,主要做一些重复性的代码的这种岗位正在被AI大量的取代。就相当于说AI把这些基础的编程任务外包出去了。
05:03
那这个报告里面有没有说不同规模的公司在未来裁员的计划上面有什么区别?
05:10
调查结果显示,有3分之1的公司都预期说会在接下来的一年当中进行裁员,而且公司的规模越大,打算裁员的比例就越高。这已经不是一个什么预测了,就是现在已经正在发生的事情。
第五件大事:AI花的电,正在超越一个国家
05:25
紧接着我们要聊的这个话题就跟大家的生活息息相关了。就是AI它在训练和使用的过程当中,到底会消耗多少能源,产生多少碳排放。
05:36
举个例子,比如说训练Grok 4这个模型,它的碳排放是达到了72816吨二氧化碳当量。那这就相当于一辆普通汽车跑一千多辈子所产生的碳排放量。
05:49
我的天哪,没想到一个AI模型背后的碳足迹居然这么大。
05:54
是,而且更夸张的是,所有的AI数据中心加起来,它的耗电量是达到了29.6吉瓦,这就相当于纽约州在用电高峰期的总耗电量。然后再比如像GPT-4o它一年光是推理所消耗的水量就超过了1200万人一年的饮水量。就是你每发一条消息,它都在背后消耗大量的水。
第六件大事:你的工资,正被AI悄悄"记录"
06:16
确实挺让人震惊的那我们再来关注一下AI给我们带来的这种经济价值,特别是美国的普通用户,他们到底从这些AI工具当中获得了多少实际的好处。
06:28
这个报告里面其实有一个很有意思的估算,就是说截止到2026年的年初,AI给美国用户带来的消费者剩余是高达1720亿美元,这是一个非常大的数字。
06:42
那这个消费者剩余具体到每个人头上是多少钱呢?
06:45
平均的话,你要让一个美国人放弃使用AI一个月,你得给他125美元。而且这个数字在过去的一年当中,整体是上涨了27%,然后中位数更是飙升了235%。但是很多人其实都没有意识到,因为这些工具大部分都是免费的,所以就感觉好像这些东西没有什么价值。但其实就像我们呼吸的空气一样。已经离不开了。
第七件大事:专家和普通人,活在两个平行宇宙
07:09
说到这个就不得不提到专家和普通人在看待AI未来上面的分歧了。这个报告里面具体有哪些有意思的对比?
07:18
报告里面做了一个很直观的表格。就比如说在医疗这个领域,只有44%的普通人觉得AI会带来积极影响,但是有84%的专家是看好的,那这个差距就有40个百分点。
07:32
哇哦看来在很多方面,专家和大众简直像是生活在两个世界。
07:37
是包括在工作方式、经济、K12教育这些方面,两边的分歧都在40个百分点左右。最有意思的是对于AI会不会让工作变少这个事情,有64%的普通人是担心的。但是专家里面只有39%的人有同样的担忧。至于谁对谁错,现在还真的不好说,但是这个认知的鸿沟本身就很值得我们去反思。
最后,一个让你松一口气的发现
08:02
OK我们接下来要讲的是AI在理解人类语言上面的短板,就是它在面对一些情感和深度的东西的时候,到底有哪些明显的不足。
08:12
实际上AI到现在为止,它还是很难去捕捉语言里面的一些细微的情感和深度。就比如说研究人员做了一个实验,当你跟AI说我相信X是真的,它还可以正常的去回应你。但是当你把相信换成觉得我觉得X是真的,那这个时候AI对于你态度的识别准确率就会急剧的下降。有些模型甚至从98%直接跌到了14%。
08:39
所以就是说AI连知道和相信这种基本的区别都没有办法分清。
08:44
这就是它的一个短板。这个短板就意味着那些真正需要去洞察人类的情感,理解一些模糊的表达,或者说需要有一些主观的判断的工作,AI还是没有办法取代人类的这其实也是我们人类目前的一个机会窗口。
总结:三个真正需要记住的结论
09:00
最后我们来盘点一下,从这些趋势当中,我们到底应该记住哪三个关键的结论。
09:06
第一个就是AI的普及速度确实是前所未有的,但是大部分人其实还没有真正的意识到它会给我们带来什么样的冲击。第二个就是最先受到影响的其实是那些年轻的做一些执行性的重复性的任务的人。所以如果你现在还在靠这种低附加值的简单重复的工作来谋生的话,那你真的要开始警觉起来了。然后第三个就是AI它的能力分布是非常不均匀的。所以我们得知道它在哪些地方是可以信任的,哪些地方是不可以信任的对这就是2026年我们真实面临的一个现状。
09:41
今天我们其实聊了很多关于人工智能最近的一些突破,包括它的一些短板,以及它给社会带来的各种各样的冲击。希望大家听完之后,能够对这个AI时代有一个更清晰的认识。
09:54
好的,本期节目咱们就到这里了,感谢大家的收听,咱们下次再见,拜拜。

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧