主播
节目简介
来源:小宇宙
Anthropic 刚把基准(SWE-Bench Pro 80.3%)刷到新高,但真实舆论场给出的却是另一份成绩单:大量日常与安全研究场景的用户切回旧模型,理由是"成本更高、护栏更烦、收益看不见"。