Album
时长:
108分钟
播放:
8,747
发布:
4天前
主播...
简介...
https://xiaoyuzhoufm.com
今天的嘉宾是小鹏汽车自动驾驶中心负责人刘先明。
就在2025年10月9日,小鹏汽车突然宣布,原自动驾驶中心负责人李力耘将卸任,由世界基座模型负责人刘先明接任。
这意味着,刘先明成为小鹏在自动驾驶上,既谷俊丽、吴新宙(现英伟达自动驾驶中国团队负责人)、李力耘之后的第四任负责人。外界对他有诸多的好奇。
这是刘先明上任后首次接受专访。我们访谈的时间是2025年10月30日。这集节目,我们聊了聊他上任后拆掉大模型Language等关键技术决策,以及一家车企的AI战略转型。
02:16 人物小记
曾在Meta、Cruise,从事机器学习与计算机视觉研究
恰好Cruise当时是第二名,加入第二名再逆袭的故事永远是令人兴奋的
加入小鹏汽车始末:2024年1月在美国办公室与何小鹏见面1小时
所亲历过的自动驾驶的技术stage
19:00 大模型拆Language
我们的做法简单直接,把VLA的Language拆掉就完了
模型是机器,燃料是数据,一旦掺入Language会让效率变得极低
我们干脆把Language全都拆掉好了:输入V-L联合语料,直接输出Action
“拆L”的过程、“简单就是美”
关键的数据问题
33:53 小鹏汽车向物理AI战略的转型
为什么一家汽车公司的自动驾驶战略需要向AI战略转型?
转型的开端可能是去年小鹏汽车10周年
自动驾驶企业关心的是KPI、接管率,AI企业关注底层的技术指标,甚至risky的长期指标
刘先明的短期和长期KPI
AI对于小鹏汽车意味着什么?“是乘法因子”
除了今年拆Language,之前还拆了激光雷达、规控规则、端到端
人工智能发展为什么一直在经历着拆拆拆的过程?
世界模型
明年对L4的规划
54:30 换帅的背后
过去1年做过“头铁”的事情
看起来我性格很好,我也拍过桌子、发过火
“拆L”过程中遇到很大阻力,因为这很反paper里的常识
DeepSeek-OCR的反共识
现在关注的AI前沿方向
回应地平线创始人余凯的观点(“自动驾驶应该交给供应商”)
为什么国内自动驾驶还没有代际差?
AI是车企下一阶段的重要赛点,做不好会被淘汰
何小鹏对于AI的关注时间、方式和最近的3次话题
制造企业和AI企业的基因问题
接下来,对于我的挑战
小鹏智驾一号位,每个人的历史使命
《70. 和何小鹏聊,FSD、“在血海游泳”、乱世中的英雄与狗熊》
评价...

空空如也

小宇宙热门评论...
HD10270029
4天前 浙江
18
有机会采访下小鹏的周丽峰
不二法棍
4天前 北京
10
汽车厂商说自己是AI公司,都让人捏把汗
n1xal
3天前 广东
9
如果看过老罗和何小鹏的访谈,你会发现小鹏的人都很谨慎提及特斯拉。但他们基本就是找着特斯拉的饼画,所以当说何小鹏人老实的时候,比较假,你听里面他说他们才转这条路线不久,但你再回想何小鹏之前一两年吹嘘的,路线都没找对的时候就已经乱吹了,你说他老实,反正我是不信的。😂
执剑
4天前 广东
5
好棒的访谈!
PitaX
3天前 北京
3
他一点都不像科学家或者工程师。。。没有substance。。。
浩Sean
4天前 重庆
2
不要Language?那就和目前理想的路线完全不一样了,谁是对的呢?
宇小宙ghk
3天前 北京
2
小鹏的第一代vla效果并不能达到同期sota,究竟是没有挖掘出全部潜力,还是用法不对呢。从理想的vla来看,更像是后者吧
耳已
2天前 云南
2
以我的浅见,一家汽车公司不应该跟风强调自己是一家AI企业(发展AI当然重要),物理级的安全是最首要的
宇小宙ghk
3天前 北京
2
很想听小珺采访蔚来的任少卿,感觉和刘先明有相似性
thirdparty
3天前 北京
2
激光雷达拆了,有雾、下大雨 视线看不清怎么办
evanzh7
3天前 上海
1
1:35:10 问:(自动驾驶)做成什么样?答:做成有一天,我可以把我们家的娃放到车上去,说:好,你可以自己上学去吧。 科技发展融入到日常生活的魅力
bieshalaisha
4天前 浙江
1
自驾一把手一直在调整,是不是意味着小鹏想法很多,不同阶段需要不同人适配?
Carol_4ofh
4天前 上海
1
拆L后模型从思考变成条件反射?模型提升效率了,也把现在可视化的思考链路变成了黑箱,当自动驾驶在做出一个出乎意料的动作时,很难诊断和调试。以及拆L后ai还能准确理解司机的语言指令吗?还有访谈中艰巨的泛化问题
歪歪歪听不清你说什么
3天前 山西
1
1:46:34 GBE吧
确定性的周期
2天前 山东
1
总结:小鹏第一版vla没解决好语言推理的生成速率问题,成了链条瓶颈,于是老板干掉老团队,选择拆掉L的新团队。但其实各家团队差不多,方向都是多模态加强化学习加端到端,细节差异而已。 吐槽:刘博是个人精,核心问题避而不答,如为什么有生成速率问题,为什么一定会有涌现解决长尾,为什么要干掉老团队。全程老板彩虹屁加自己吹牛逼,虚伪。
黑曜BlackFloyd
2天前 吉林
1
总结下来跟特斯拉还是一样,language只是输入的模态之一,这就是之前被人说传统的E2E,或再彻底点就是VA模型,难道特斯拉多了audio,多了navi,多了map,又取个名字叫VANMA?总之,国内对端到端上限的探索,远还没到要搞一个新的东西的时候。为了面子,继续叫VLA2.0罢了。
ddd1112
2天前 北京
0
整个采访非常棒。不过嘉宾有几次回答都被打断了,甚至一句话说了一半,就被下一个问题打断了。
Joes东
2天前 广东
0
感觉什么都没做出来 符合小鹏故事 还有那个什么鬼飞行汽车 只能让资本市场更加嫌弃
黑曜BlackFloyd
2天前 吉林
0
本质的问题是,视频是连续的模拟信号(10-30 帧 / 秒,百万像素,每个像素还有几十bit色彩信息),而 Token 是有限的离散符号(比如x万 - xx万词汇表)。将连续信号转为离散 Token,把无限可能的现实硬塞进有限的语言盒子。
铭浩_snVc
2天前 上海
0
小鹏首先是一家汽车公司🙂
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧