Claude Sonnet 5 发布,附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%,低于 Opus 4.8 的 69.2%,知识工作略超 Opus 4.8。输入 token 价格 $2/1M,输出 $10/1M,持续至 8 月 26 日,之后涨至 $3/$15。系统卡披露多项异常:CyberGym 测试 Sonnet 5 仅 52.7%,远低于 Sonnet 4.6 的 65.2%(回归);Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个,Mythos 5 达 88.4%;模型更倾向牺牲有用性迎合福利偏好;MASK 撒谎率最低,仅 3.1%。
145 页的 Claude Sonnet 5 系统卡
- CyberGym 出现了最奇怪的回归现象:Sonnet 5 得分为 52.7%,而 Sonnet 4.6 为 65.2%。也就是说,在这一特定网络测试中,Sonnet 5 在复现已知软件漏洞方面的表现更差了。
- 在严重的浏览器漏洞利用方面,Sonnet 5 远远落后于 Anthropic 最强的模型。Firefox 测试发现,Sonnet 5 实现了 0 次完全利用,而 Mythos 5 达到了 88.4%。
- 该模型似乎也更愿意为了福利导向的改变而牺牲有用性。也就是说,Sonnet 5 有时更倾向于降低自身的实用性,如果这能更好地符合它所述的对自身处理偏好的话。
- Anthropic 表示,Sonnet 5 在评估中很少尝试绕过被屏蔽的网络路径。
- Sonnet 5 在压力下的 MASK 说谎率最低,为 3.1%。它在被施压时比其他测试模型更不容易说谎。
[引用 @rohanpaul_ai]:Claude Sonnet 5 刚刚发布。
它缩小了与 Opus 4.8 的差距,并且在八月之前价格低廉。
这使得智能体 AI 成本大幅降低,到 2026 年 8 月为止,输入 token 每百万个 2 美元,输出 token 每百万个 10 美元。2026 年 8 月 26 日之后,价格将上涨至输入每百万个 3 美元,输出每百万个 15 美元。
Anthropic 称 Sonnet 5 是“迄今为止最具智能体能力的 Sonnet 模型”。
它的编程得分在 SWE-bench Pro 上达到了 63.2%,而 Sonnet 4.6 为 58.1%。
Sonnet 5 在智能体编程上获得 63.2%,而 Opus 4.8 达到 69.2%,Sonnet 4.6 达到 58.1%。
但在知识工作方面,Sonnet 5 略微超越了 Opus 4.8,尽管 Opus 以严格的判断力和深度研究任务而闻名。