主播
节目简介
来源:小宇宙
在过去十几年里,我们默认AI的学习,核心都是在调整模型的参数。但有一个问题始终卡在整个AI领域的咽喉位置,那就是持续学习中的灾难性遗忘。就在最近,OpenAI的工程师翁家翌发布了一篇名为《超越梯度的学习(Learning Beyond Gradients)》的文章,用一系列堪称惊艳的实验,提出了一种完全跳出梯度框架的全新学习范式,启发式学习(Heuristic Learning)。他用编码Agent代替人工,不训练任何神经网络,不更新任何模型权重,仅仅通过修改代码规则和维护软件系统,就让AI在Atari游戏和机器人控制任务中,达到了深度强化学习的水准,甚至在样本效率上实现了反超。这篇文章不仅解释了为什么传统规则系统一直没有发展起来,更是指出了持续学习的全新破局方向。接下来,我就来给大家梳理一下。
https://trinkle23897.github.io/learning-beyond-gradients/#zh
原视频来自:https://youtu.be/1vOeJ6xFL_E
聊天讨论群,可加微信gxjdian入群,需备注,来自播客AI前沿
https://trinkle23897.github.io/learning-beyond-gradients/#zh
原视频来自:https://youtu.be/1vOeJ6xFL_E
聊天讨论群,可加微信gxjdian入群,需备注,来自播客AI前沿