AI前沿 - 启发式学习Heuristic Learning | OpenAI翁家翌 - EarsOnMe

主播

节目简介

来源：小宇宙

在过去十几年里，我们默认AI的学习，核心都是在调整模型的参数。但有一个问题始终卡在整个AI领域的咽喉位置，那就是持续学习中的灾难性遗忘。就在最近，OpenAI的工程师翁家翌发布了一篇名为《超越梯度的学习（Learning Beyond Gradients）》的文章，用一系列堪称惊艳的实验，提出了一种完全跳出梯度框架的全新学习范式，启发式学习（Heuristic Learning）。他用编码Agent代替人工，不训练任何神经网络，不更新任何模型权重，仅仅通过修改代码规则和维护软件系统，就让AI在Atari游戏和机器人控制任务中，达到了深度强化学习的水准，甚至在样本效率上实现了反超。这篇文章不仅解释了为什么传统规则系统一直没有发展起来，更是指出了持续学习的全新破局方向。接下来，我就来给大家梳理一下。
https://trinkle23897.github.io/learning-beyond-gradients/#zh
原视频来自：https://youtu.be/1vOeJ6xFL_E
聊天讨论群，可加微信gxjdian入群，需备注，来自播客AI前沿

启发式学习Heuristic Learning | OpenAI翁家翌

加入我们的 Discord

扫描微信二维码

播放列表