Vol.23 【嗨点小圆桌】当AI界只剩一个声音,会既无趣又危险|对谈 AI 科学家靳潇杰、刘淼
硅基立场

Vol.23 【嗨点小圆桌】当AI界只剩一个声音,会既无趣又危险|对谈 AI 科学家靳潇杰、刘淼

79分钟 401 6天前
节目简介
来源:小宇宙
语言模型(LLM)引领了过去4年的AI狂奔,相信它会带领我们抵达AGI终点的人们,掌控了前所未有的金钱、资源、人才、算力甚至能源,在产业界一切都已经“收敛”。
但越是这样的时刻,对不少经历过AI研究起伏的科学家来说,它越可疑。
越是看起来“共识”明确的时候,描述这个剧烈演变的时刻越是困难,也越是重要。
在刚刚过去的中关村论坛间隙,硅星人合伙人王兆洋与前 Meta 高级研究科学家、参与了Llama系列多模态核心研发的刘淼,以及字节跳动美国研究院创始成员,前 Google 研究院科学家靳潇杰一起聊了聊今天他们眼中我们所处的时代。
两人去年纷纷选择从硅谷回国,目前分别在清华和北交大任教。作为拥有横跨中美以及产业界与学术界经验的学者,以及在LLM的强势叙事之外寻找着新方向,做了非常多有价值且充满启发的研究的学者,他们分享了自己的职业生涯和研究思路,给今天的AI发展提供了很多不同的声音。
希望这些声音会帮助更多人找到自己在今天的那个benchmark。
【关于 嗨点小圆桌】
今年中关村论坛期间,海淀区人工智能主题日场外氛围活动“原点 Party Nights”在AI原点社区举办。其中音视频播客“嗨点小圆桌”是一档“海淀和他的朋友们”深度对话节目,将邀请主论坛嘉宾、AI热点人物一同探讨AI青年关心的热点话题,欢迎大家收听观看体验。
【本期嘉宾】
刘淼:清华大学人工智能学院助理教授,前 Meta GenAI 高级研究科学家, Llama3/Llama4 多模态核心研发成员;
靳潇杰:北京交通大学计算机学院教授、博导,字节跳动美国研究院创始成员及技术负责人,前 Google 研究院、Snap 研究院研究员
王兆洋:硅星人合伙人
【时间线】
05:43 AI 行业完全进入一个正反馈阶段,而这其实从来不是AI研究领域的常态
06:38 今天整个 AI 在技术方面过于聚焦了,这是令人不安的乌云
13:37 起起伏伏的 AI:2022年“入行”的刘淼,和2017年拿到 Image Net 最后一届冠军的靳潇杰
16:11 语言,是我们需要的全部吗——VideoWord 的诞生
27:02 Ego4D 与 MEOW 实验室:从用户驱动到任务驱动
27:40 CLIP:一个被忽视的但非常关键的工作
32:10 当 LLM 统治一切技术路线:在工业界你没有"动摇"的权限
43:58 50 年之后,我能非常确信 AI 一定是一个主动的个人化的智能
45:07 学术界的 GPU 危机:资源受限是诅咒还是倒逼创新?
54:09 的研究院,能不能做出真正的研究?
01:01:35 人不是为了有什么价值而存在的
01:07:10 当看到一个小女孩因为 AI "姐姐"要下线而哭
01:08:53 在训练 Llama 时发现,修改后训练数据可以轻易决定模型的偏见和世界观
01:12:15 未来方向:世界模型,AI的情感,人与机器人的交互
【延伸阅读】
本期对话中涉及的关键论文与资料:
Transformer 与注意力机制
* Vaswani et al. (2017),Attention Is All You Needarxiv.org
CLIP:图文对齐的奠基工作
* Radford et al. (2021),Learning Transferable Visual Models From Natural Language Supervisionarxiv.org
Ego4D:第一视角视频大规模数据集
* Grauman et al. (2022),Ego4D: Around the World in 3,000 Hours of Egocentric Video(刘淼为共同作者)arxiv.org
VideoWorld:不依赖语言的视觉世界模型
* Ren et al. (2025),VideoWorld: Exploring Knowledge Learning from Unlabeled Videos(靳潇杰为通讯作者,CVPR 2025)arxiv.org
* VideoWorld 2(2026,靳潇杰团队最新续作)arxiv.org
ImageNet 竞赛:深度学习时代的起点
* Russakovsky et al. (2015),ImageNet Large Scale Visual Recognition Challenge(ILSVRC,靳潇杰 2017 届冠军)arxiv.org
MEOW LAB(Modeling Egocentric Omniscient Worlds)
* 致力于构建 “看你所见、学你所会、懂你所想”的下一代人本能智能系统
* collegeai.tsinghua.edu.cn

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧