Album
时长:
27分钟
播放:
449
发布:
7个月前
简介...
https://xiaoyuzhoufm.com

AI正在成为这个时代最重要的变革力量,但它的讨论却常常充满门槛。术语的混乱让外行难以理解,信息的碎片化让人难以构建完整的认知。这期节目,希望让 AI 不再是少数人的“黑话”,而是所有人都能真正理解、思考并参与塑造的未来,因为未来属于那些真正理解它的人。


我将以Lex Fridman最新一期长达5个小时的播客中的热门话题和精彩观点为基础,深入浅出地解释他们讨论中的核心 AI 概念,比如“AI行业里并没有达成一致的关于开源的定义”、“大模型的参数权重”、“预训练 vs. 后训练”、“对齐”、"Token"、“思维链chain of thoughts"、“MoE“、“DeepSeek绕开英伟达"、“集群”、“AI智能体AI Agent"等。


01:43 先介绍一下三位人物,Lex Fridman...


03:06 DeepSeek和OpenAI之争,被很多媒体和自媒体简单的说成了"开源"与"非开源"之争。


03:16 在人工智能领域,关于"开源"的定义到目前为止并没有完全统一一的一个共识。


06:29 大模型的参数权重,就像是大模型的记忆力,他们存储了模型从海量数据中学到的模式、规律和知识。


07:37 权重的公开并不等于模型完全开源。


08:17 Nathan所在的研究机构认为,真正的开源应该不仅仅包括开放源代码,还应该包括:发布训练数据,发布训练代码,并且发布参数权重。


08:54 接下来我先介绍“预训练”和“后训练”。


09:30 在像GPT这样的大语言模型当中,Token是一个是文本中的一个较小的单元,可能是一个单词、一部分单词,甚至是一个标点符号。


11:31 在人工智能领域,对齐、alignment,主要是指确保AI系统的行为和目标,与人类的意图、价值观和期望一致。


13:53 预训练通常成本更高,训练时间更长。


14:13 接下来再介绍一下“推理过程的显性化”这个概念,也就是大家从DeepSeek R1中看到的,R1完整的展示了整个推理的逻辑。


15:07 相比于传统的黑箱模型,Chain of Thoughts有助于帮助人类理解模型是如何做出判断的,从而提升了整个模型的可信度。


15:41 这个“混合专家系统” MoE的核心思想是...


16:15 在OpenAI实现MoE架构之前,行业里没有人相信这个MoE的paper真能work...


16:49 关于DeepSeek没有直接去直接调用英伟达CUDA API,也就是NCCL API(绕过英伟达)...


18:31 谈到当前人工智能领域的数字集群的规模...


21:01 除了电力供,GPU的冷却也是一个大问题。


21:30 未来,谁最可能成为英伟达的竞争对手或者是替代品?


22:42 目前在人工智能领域,谁在赚钱?


23:11 关于AGI,通用人工智能...


23:30 关于未来AI的价值到底会从哪种形式呈现...


23:39 这里又提到了AI agent(AI代理)的概念...


24:12 OpenAI前几周发布了自己的第一个AI agent, 这个产品的名字叫做OpenAI Operator.


25:48 他们三位也谈到了程序员与AI之间的关系,以及未来的发展


评价...

空空如也

小宇宙热门评论...
jeff在pokkoa
7个月前 上海
1
非常清晰👍🏻
阿白_MjCB
7个月前 河南
1
这里没懂 开放了API 和开源应该不沾边啊 怎么模糊了
一只小肥猫
7个月前 上海
1
谢谢主播整理
EarsOnMe

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧