Claude Fable 5 跑分碾压,Reddit 却说"我不需要更好的模型了"
Web3+

Claude Fable 5 跑分碾压,Reddit 却说"我不需要更好的模型了"

8分钟 33 5天前
节目简介
来源:小宇宙
Anthropic 刚把基准(SWE-Bench Pro 80.3%)刷到新高,但真实舆论场给出的却是另一份成绩单:大量日常与安全研究场景的用户切回旧模型,理由是"成本更高、护栏更烦、收益看不见"。

加入我们的 Discord

与播客爱好者一起交流

立即加入

扫描微信二维码

添加微信好友,获取更多播客资讯

微信二维码

播放列表

自动播放下一个

播放列表还是空的

去找些喜欢的节目添加进来吧