AI 进化论

AI界名字最霸气的两位华人研究员：姚顺雨和姚顺宇

13分钟 227 2个月前

主播

Innopath 1 档播客

RivendellHY 1 档播客

节目简介

来源：小宇宙

先认识一下这个人
00:01
今天咱们要聊的是人工智能这个行业。为什么真正推动这个行业进步的其实并不是那些神话般的天才，而是靠靠谱的人，靠团队的合作以及强大的执行力。没错。然后我们也会聊到在这个行业里面机会的稀缺和基础设施是怎么决定了大家的高薪。
00:26
没错，这些因素确实很关键。那我们就直接进入今天的讨论。
00:30
好的，咱们第一个话题就是这个主角的背景和大家经常会搞混的一件事情。就是硅谷有两个名字非常像的清华的毕业生，这两个人到底有哪些经历上的不同？
00:43
这两个人经常被大家弄混，其中一个去了腾讯，另一个就是我们今天的主角。他是先在Anthropic参与了Claude3.7的开发，然后又跳槽到了GoogleDeepMind做了Gemini3。
00:56
他的这个学术背景跟他后来的这些选择有没有什么联系？
01:00
他本科是在清华，然后博士去了斯坦福，学的是量子物理和高能物理。但是他自己有讲过一句话，就是说AI这个事儿本来也不太需要脑子，真的不太需要脑子。我觉得都是一些本科生就能干的活。
01:13
听起来很自信，那他这个自信是从哪儿来的呢？他对人工智能这个行业到底是怎么看的？
观点一：AI 不需要脑子，但需要你靠谱
01:18
他的核心观点就是很多人把人工智能想得太神秘了，觉得这一定是天才才能干的事儿。但是他认为这个行业其实最看重的是靠谱，做事细致和责任心。
01:31
就是说他觉得聪明并不是最重要的对。
01:34
因为他自己有做过物理，然后他就觉得高能理论物理才是真的难。就是它的实验验证非常的滞后，理论对不对？很多时候只能靠几个权威去拍板。但是AI不是，AI是你有一个想法，你就可以去跑个实验，有数据做标准，你可以不断的去调，直到你把它做出来。所以他觉得这个领域聪明人其实不少，但是真正稀缺的是那些可以把实验坚持到底，把每一个bug都修好，绝不轻易放弃的人。
观点二：个人英雄主义已死，但"英雄"们可能不知道
02:03
说到这儿我有个问题，现在大家还会把人工智能的进步归功于某几个英雄式的人物吗？
02:10
其实现在这种个人英雄主义已经过时了。虽然现在很多媒体还喜欢去渲染某一个大佬跳槽了，然后某一家公司的估值就飞涨了。或者说某一个人发了一条推特就引起了整个行业的热议。但是他其实是不太认同这种现象的。
02:27
他的理由是什么？他的理由是说在Transformer出现之前，确实是有那么几个人，他们提出了关键的想法，可以算是英雄。但是自从那儿之后，更多的是靠一个团队去持续的推进，才能够把这个东西做大。所以他觉得很多成果其实就是赶上了好的时机，赶上了好的项目，再加上大家靠谱的去执行。他甚至说自己参与Claude3.7，他也不觉得自己有多重要，他觉得他只是幸运。
02:57
但是他在评价同行的时候，还是会用自己的标准去说谁谁谁怎么样，这是不是也是一种英雄心态的残留？
03:04
他虽然说他自己很谦虚，但是他其实也会去直接的说谁谁谁傻，谁谁谁说话没有意义，甚至有“not even wrong……”的这种说法去评价别人。所以他其实是在解构别人的英雄光环的同时，他自己还是有一点点保留了这种评判的特权。这种矛盾还是挺有意思的。
番外加料：他顺手给"老登"下了一个定义
03:26
的确。咱们接下来这个话题，就会涉及到他对于高能物理领域的一些老资格的人的看法，他是怎么去区分这些人的？
03:35
他其实是有一个特别有意思的定义。他说人年纪大了会变成两种状态，一种是德高望重，就是他少指手画脚，还会花自己的力气去培养年轻人。另一种人就是“老登”，自己也不懂，还爱指手画脚。
03:49
所以在他的这个定义里面，“老登”其实跟年龄和资历都没有什么关系，核心就是这个人爱不爱指挥别人。
03:56
完全正确。而且他还说“老登”最高级的操作就是他说的话永远都是那种"not even wrong"，就是永远模糊，永远正确，但是永远没用。你都没有办法去反驳他，因为他根本就没有说过任何有实质内容的东西。
04:12
那他为什么会觉得人工智能这个行业就摆脱了这种主观的评价？
04:17
他的观点就是说AI行业有非常明确的评价标准，模型跑出来的数字就是硬通货，谁也没有办法去左右。所以在这种情况下，那些所谓的老登就没有办法再去用他们的个人喜好去绑架整个领域的发展。这也是他为什么喜欢AI行业，除了钱之外的最大原因。
观点三：Anthropic 是怎么 all in 押注 coding 的？
04:35
明白了。那我们现在来谈谈关于Anthropic这家公司，他们是怎么会突然之间决定说要全力投入到代码相关的AI研发当中的。
04:45
其实这个背后有一个很有趣的故事转折，就是他们一开始也没有什么深谋远虑。就是因为当时Claude3发布了之后，有人在推特上面比较说，Claude3好像写代码比GPT4还要厉害。
05:00
就因为网上的一场讨论就改变了公司的战略方向？
05:03
因为那个时候GPT4是公认的很强的，所以能有一个模型在某一个关键的能力上面超过它，立刻就成了一个大新闻。然后Anthropic的管理层就非常迅速的抓住了这个信号，他们就马上决定说我们要把我们的重心转移到coding上面。所以他们的这个决策其实是非常快速的。
05:24
那他们这个决策背后有没有什么关键的技术突破呢？
05:28
这就说来话长了。其实Claude在coding上面能够超越GPT4并不是说靠运气，而是因为有一个团队做了一个非常重要的技术决策。但是这个决策现在因为NDA的原因没有办法对外透露。
05:42
原来是这样。那就是说外界其实是不知道这个真正的突破口是什么的。
05:46
对外界是不知道的。而且他半开玩笑的说，这个东西很有可能就是一开始的时候只是一个尝试，没有想到就无心插柳柳成荫了。然后他们公司看到了这个推特上面的讨论之后，马上就决定说要全力投入。所以整个这个过程非常的体现了他们公司的这个执行力。就是从一个小小的偶然的优势到最后变成一个公司级的战略，中间几乎没有什么犹豫。
06:15
但是我想问一下？为什么很多公司就是即使知道了别的公司公开出来的一些技术秘诀，他们也没有办法直接复制出同样的AI成果呢？
06:23
这个就说来话长了，其实他有专门讲过这个问题。他说大家老觉得说好像有一个什么配方，就像做菜的配方一样，我只要知道了我就能做出同样的菜来。但是在AI这个领域其实完全不是这么回事儿。
06:37
所以就是说这个所谓的技术秘诀其实并没有大家想象的那么万能。
06:42
他就说这些技术的tips大家都很想听，然后公司又不让你说。但是其实说出来也没啥用。因为真正的AI训练它是一个系统工程，每一个技术细节都和公司的底层基础设施是深度绑定的。
06:57
就是说A公司的一个技巧到了B公司就根本跑不起来。
07:01
是的，他还举了个例子说，强化学习里面不同公司用来生成训练数据的机器和用来更新模型权重的机器是差别很大的。有的公司这两者差异极大，算法设计的核心就是怎么控制这个差异，让训练稳定。然后有的公司是它的基础设施做得好，差异小，他就可以把更多的精力放在训练效果上。所以他说知道别人怎么做的不等于你能做出一样的结果，这才是tips没用的真正原因。
07:30
我就有点纳闷了，为什么有些公司能够在AI领域迅速的推进新的想法，而其他公司就做不到？
07:37
他其实也讲了这个问题，他说关键就在于技术和管理的决策权是不是在同一批人手里。他举了Anthropic这个例子，就是他们的技术负责人，同时也是公司的创始人，所以他在技术圈里面是非常有威望的。然后他也有权利去推动公司的决策，所以他们就可以非常快速的去决定要做什么，要投入什么。
07:57
也就是说只要技术大拿和公司的管理层不是同一拨人，这个公司就很难做到这种高效的决策，是吗？
08:05
也不能这么说，他也举了OpenAI的例子，他说OpenAI就干不了，Ilya在的时候或许可以，但是后来发生了什么大家都知道了。他说top down最大的难点就在于做技术决策的人必须也得是公司的决策人。
番外：他为什么离开 Anthropic？
08:20
好的,那咱们接下来这个话题就非常有意思了。就是他为什么会选择离开Anthropic.
08:26
这背后的原因还挺直接的。他在那儿待了快一年，然后也参与了Claude3.7的这个开发，也经历了公司从七八百人扩张到将近2000人。但是他还是选择要走，他给出了三条非常坦率的理由。
08:41
那第一个理由是什么？
08:42
第一个理由就是他不认同他们CEO在一些公开立场上面的做法。他觉得Dario把反华的这个事情推到了一个非常极端的程度，他觉得这是一个非常情绪化的体现。而且他作为一个员工，他也很明确的表达了他的不同意见。
08:59
那公司规模变大之后，文化氛围有什么让他觉得难以接受的变化吗？
09:04
有啊，他说就是人多了之后，就有很多人开始在Slack上面天天讲一些正确的废话，然后大家谁都不落地。他就引用了一句 “Idea is cheap 难的是怎么把它变成一个小的可实现的步骤做出来。”
09:21
他说的很对，那还有其他原因吗？
09:23
还有一个很关键的原因，就是他觉得在Anthropic可能学到的东西越来越有限了。因为他们公司就只做coding agent和强化学习，像多模态生成和系统底层他们都不碰。所以他为了要继续成长，就选择去了Google DeepMind。然后他也给了一个建议，就是说很多人换工作之后会后悔，是因为他们根本就没有想清楚自己想要什么。
09:47
说到这儿，我有个问题。他当时离开的时候是怎么看Anthropic的未来的？
09:53
他当时走的时候其实是挺悲观的，他觉得靠卖token是一个很难有优势的事情，然后觉得未来肯定会陷入价格战。但是后来他也承认自己错了，就是Anthropic他们后来做了Claude Code，然后也做了Cowork，在产品上面做了很多很巧妙的创新，慢慢的也打开了局面。
10:12
看来他对自己的这个判断,失误还挺坦诚的。
10:14
对，而且他说后来首先是OpenAI被google揍了一拳，然后Anthropic自己又上道了。他虽然说他悲观错了，但是他说他也完全不后悔离开。
观点四：OpenAI 救了 Google 一命
10:26
行，我们接下来就聚焦在一个非常犀利的观点上面，就是OpenAI到底在google的这场AI的博弈当中扮演了一个什么样的角色。
10:36
关于这个，他其实讲的还挺直接的。他说大家都曾经担心过AI的聊天机器人会彻底取代google的搜索，让google陷入困境。
10:46
但是事实好像并没有那么极端。对吧？
10:48
对吧？是的，他的分析是OpenAI先推出了chatbot，这一下子就把google打醒了，然后google就不得不全力以赴去做这面。但是呢，OpenAI其实也没有把搜索市场给吃掉，只是分走了一小块，反而让google有机会反击。所以他说从某种意义上来说，OpenAI是救了google一命行了。
11:10
那他怎么看google在这场竞争当中的机会？
11:13
他特别提到就是说google最擅长的就是做出一个极简的产品。但是背后的技术是可以把对手卷死的那种，就像当年的搜索一样。所以只要这个聊天机器人没有把搜索彻底颠覆掉，那google就有机会再一次用技术把主动权夺回来。
番外：那些被"哔"掉的瞬间
11:30
行，我还有个问题，就是他在采访当中是怎么去评价那些经常说一些非常宏大但是又非常模糊的观点的AI行业的大佬的。
11:40
他其实有好几个地方都直接给消音了。就比如说他说某一个neo lab的创始人，他都不知道他们到底要干嘛。然后他还说叉叉叉一直挺蠢的，蠢的始终如一。
11:53
看来他是毫不留情。那他有没有用什么特别的说法去形容这种怎么说都不会错，但又没什么实际内容的话？
12:01
有啊，他就用了一个物理里面的术语，叫做"not even wrong"。就是说这些人讲的话错误程度还不够，因为他根本就没有具体到能够被证伪的程度。就是他说什么都对，然后他怎么都可以解释，那跟没说有什么区别呢？
最后：如果 AI 这么简单，为什么工资这么高？
12:18
最后咱们来探讨一下，就是现在这个AI行业为什么工资会这么高？
12:23
他的看法还挺有意思的。他说这个高薪其实并不完全是因为能力有多稀缺，更多的是因为你只有有机会去做这个事情，你才能够学会这个事情。他原话就是说你得有那个机会去接触这件事儿，你才能学会这件事儿。你没有那个机会再聪明也没用。
12:42
所以他的意思是说，能进到这个圈子里面比你的智商更重要。
12:47
没错，他就说这其实是一个技术门槛、机会门槛和市场的热度三者共同作用的结果。然后他还特别说说纯做语言模型研究的。末班车在Claude 3.7那代就已经发车了，就现在已经不是蓝海了。但是他自己就是那班车上面的人。
13:05
好吧，今天我们聊了很多，从这个行业的底层逻辑，到团队合作的重要性，再到个人的成长和选择。其实人工智能这个领域比大家想象的要更接地气一些。
13:18
好了，这就是本期播客的全部内容了，我们下期再见，拜拜。

$EarsOnMe$

EarsOnMe

外观

AI界名字最霸气的两位华人研究员：姚顺雨和姚顺宇

加入我们的 Discord

扫描微信二维码

播放列表