第23期丨RNN的长期失忆症
白话-大模型

第23期丨RNN的长期失忆症

11分钟 108 1个月前
主播
节目简介
来源:小宇宙
【第23期】AI终于有了记忆,却很快患上了长期失忆症。
这一期我们从Elman网络讲起:为什么只是把“计算结果”换成“隐藏状态”,就让机器第一次在预测下一个词的过程中,自己发现了语法结构?而本吉奥又为什么在1994年指出,简单RNN存在一个残酷矛盾:记得住和学得会,两者不可兼得?
这期是理解RNN、LSTM,以及后来大语言模型的一块关键拼图。
* [00:00:15] 回顾 Jordan 与 Elman 网络的开山地位及其结构差异。
* [00:00:45] 深度类比:为什么“电影好不好看”只是结果,而脑中的“复杂感受”才是灵魂。
* [00:01:35] 揭秘“隐藏状态”:为什么语境判断比上一步的输出更重要?
* [00:02:05] 认知科学家的执着:埃尔曼对乔姆斯基“天赋论”的怀疑与挑战。
* [00:02:35] 迷你的“语言世界”实验:29 个单词与 1 万个句子的奇妙训练。
* [00:03:46] 神奇的涌现:AI 如何在无监督下自行长出一棵“层级分类树”。
* [00:04:42] 跨越 40 年的共鸣:Elman 网络作为大语言模型(LLM)早期微光的意义。
* [00:05:05] 总结:预测序列、在错误中学习与结构的自发形成。

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧