136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS
张小珺Jùn|商业访谈录

136. 全球大模型季报第9集:和广密聊,Coding是AGI第二幕、硅谷御三家真相、模型正成为新一代OS

82分钟 5.4万 1周前
节目简介
来源:小宇宙
今天给大家带来的是全球大模型季报第9集,这一集的情绪十分复杂。
一方面,你会看到正在急速进化的AI革命。Coding把AI从聊天机器人Chatbot第一幕,推向了能够干活的Agent第二幕。研究员们已经不再亲自写代码。广密带来的核心判断是,Coding是新的”AI加速器",正在加速AGI实现,领先的Coding模型就像领先的GPU。
另一方面,社会层面随之进入白领通缩与失业的窗口。整个社会准备好了应对这么剧烈变化的AI革命吗?
OUTLINE:
00:02:00 第9集季报的概览
00:03:28 硅谷体感与洞察
过去一个Q,智能水平进步幅度赶上2025全年,推背感非常强,AI奇点时刻应该很快就到
最关键转折点就是Opus 4.5 → Opus 4.6模型,算是GPT-3 → GPT-4跨代际提升的模型
今年6月之前可能还会再有一个从GPT-3→4水平幅度的跨越,OpenAI/Anthropic新模型都很强,Mythos/Spud下一代也开始训练了,继续加速
Coding会是头部的放大器,最顶尖1的人才能放大10-50倍的生产力
你是否相信Code可以表达数字世界的绝大多数任务?“语言即世界,代码即方案”
如果领先的模型公司不重视Coding,大概率会掉出第一梯队
Coding就像Amazon最早卖书一样,借助卖完书把所有仓储物流用户全都拉通了
Coding在整个AGI的历史进程中处在什么位置?
做好Coding的难点到底在哪里?不只是技术knowhow,更是战略组织和文化问题
00:22:10 硅谷御三家内部真实情况
00:22:10 Anthropic
All in Coding不是day1这个团队就想清楚的
创始人特别hands-on亲自看训练数据,重视数据和重视技术细节刻在基因里
偏好“underdog”而非大人物,文化面试非常严格,尤其是看重一个人的文化特质
00:33:35 OpenAI
在这个时代的过去胜利秘诀,可能是下个时代的毒药
过去OpenAI在ChatGPT的成功,让他们专注ToC忽视了Coding
重点说下OpenAI做的不好的地方,可以在构建组织的时候借鉴一下
OpenAI即将要发布的新模型,是真正意义上的GPT-5吧
00:47:13 Gemini
Gemini 3被高估
Coding严重落后,Google最大的战略失误
Google是最领先的追随者,资源和布局上没啥绝对短板,但战略跟随OpenAI/Anthropic,掉队可能性很低
00:54:16 Meta TBD
最有机会的挑战者,已经取代xAI,成为硅谷4号种子
00:58:07 xAI
xAI短期基本上掉队了,最大问题感觉也是战略摇摆
崩溃始于founding team逐渐离开
01:02:00 Harness Engineering
01:03:57 中国御三家
01:05:42 模型是新一代操作系统
01:07:01 潜在的社会影响,失业、通缩
01:14:36 硅谷新趋势和投资新思考
《全球大模型季报》系列追踪:
2023: 54. 口述全球大模型这一年:人类千亿科学豪赌与参差的中美景观
2024Q1: 64. 和广密聊AGI大基建时代:电+芯片=产出智能
2024Q2: 69. 口述全球大模型这半年:Perplexity突然火爆和尚未爆发的AI应用生态
2024Q3: 73. AGI范式大转移:和广密预言草莓、OpenAI o1和self-play RL|全球大模型季报4
2024Q4: 86. 大模型季报年终特辑:和广密预言LLM产品超越Google之路
2025Q1: 97. 25年Q1大模型季报:和广密聊当下最大非共识、AGI的主线与主峰
2025Q2-Q3: 112. 和广密聊大模型季报:分化与收敛、全家桶与垂直整合、L4体验与挖矿窗口
2025Q4: 127. 大模型季报跨年对谈:和广密预言一场AI War、两大联盟和第三个范式Online Learning
LINKS:
我们的播客在小宇宙、Apple Podcast、Spotify等全音频平台播出;
我们的视频播客在Bilibili、小红书、视频号、抖音等全视频平台播出;
如果你想服用文字版,请搜索我们工作室的公众号:语言即世界language is world。
DISCLAIMER: 本内容不作为投资建议。
CONTACT: [email protected]
Jump into the new world-and explore with us!😉
小宇宙热评
HD4047p
1周前 四川
21
少聊了两个重要的问题:1. 中国模型离御三家的差距是缩小还是扩大了,以及在终局,开源模型是否能在90%的任务上胜任。2. 投资组合为什么只包含模型,而不是包括AI芯片在内的半导体产业。
井然丶
1周前 广东
11
太好了,是广密,我们有救了!/手动狗头
祖春山
1周前 北京
11
16:13 语言即世界,代码即方案,智能体即?
Ayano_83su
1周前 广东
10
33:11 最牛逼的AI Researcher都担心自己1-2年后没有工作了... 程序员也在担心自己1-2年后没有工作了
魔都侦探
1周前 上海
8
AI进展太快了,季报感觉和年报一样
RayZheng
6天前 加拿大
7
是不是最水的一期,街边老大爷认知
庄明浩
1周前 上海
7
05:53 “挡不住了”
欢喜HD
1周前 英国
5
有幸见证这次浪潮,强如广密这次更多也说了很多次不知道,都很乐观,“5050”等
捺西索斯
6天前 北京
4
这集真的是绝望的一集
不爱吃面爱吃卤煮
1周前 海南
3
来了,老李别走了,常驻吧
kb34
6天前 广东
3
ai之后的世界看上去就是两拨人: 一小撮想要和“上帝”掰手腕,知识负担更重的人/ 和一大群“惊恐的绵羊🐑”,哈哈😂
aibiubiu
1周前 广东
3
硅谷御三家讲了四十分钟,国内御三家不到四分钟,两边差距越来越大了😂😂
快乐小龙哥
6天前 广东
2
23:03 A社对于coding的训练选型和战略执行非常到位。这也是opus引领AGI第二幕的原因🥊。令人佩服的公司!
random_path
5天前 北京
2
感谢广密和小珺每个季度给大家分享观察!不过有一点没想明白,其实 opus 4.5 去年 11 月就发了,但是似乎大家即便一直在跟硅谷一线 researcher 聊,也没有预见到 anthropic 今年出圈和 arr 垂直飙升的速度(去年 12 月当时主流话题还是在讨论 oai 和 goog)。似乎大家都是慢了一点要到 2 月 arr 出来以后,或者是稍早点 anthropic 击溃美国 saas 开始才意识到今年第一季度的主角。或者甚至可能 Dario 自己都没意识到(去年底今年初我记得 Dario 还在峰会上阴阳 sam 锁芯片产能是瞎搞,当成 YOLO,结果转头自己晚了两个季度,只能再加价 50%-100% 去找锁...)
张睿
6天前 美国
1
没讨论deepseek ?
三五七言neal
6天前 浙江
1
49:08 当嘉宾说出Gemini3没有那么强的时候,说明嘉宾的认知有局限
岛森海
6天前 英国
1
33:44 对工作悲观 反映的是对AI能力的乐观呀
HD963717x
5天前 河北
1
我觉得还是taste,claude现在甩其他公司几条街。
Miracle_June
6天前 广东
1
10:19 我记得上次还在聊oa卖广告能卖几百亿呢
liu_0Xci
6天前 山东
1
墙头草水平的嘉宾...

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧