LLM是如何思考的 | 自然语言自编码器NLA | Anthropic
AI前沿

LLM是如何思考的 | 自然语言自编码器NLA | Anthropic

17分钟 351 1周前
节目简介
来源:小宇宙
5月7日,Anthropic发布了一篇关于机制可解释性的最新研究,自然语言自编码器(Natural Language Autoencoders),简称NLA。从稀疏自编码器SAE到今天的NLA,Anthropic一直在试图撬开大模型的黑盒,而这一次,他们直接把大模型内部高维到人类完全无法理解的激活向量,翻译成了我们能逐字读懂的自然语言。这期我们就来介绍一下这项研究。
https://www.anthropic.com/research/natural-language-autoencoders
https://transformer-circuits.pub/2026/nla/index.html
https://www.goodfire.ai/research/interpreting-lm-parameters
原视频来自:https://youtu.be/aOWdyqUHkmc
聊天讨论群,可加微信gxjdian入群,需备注,来自播客AI前沿

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧