Rohan Paul@rohanpaul_ai

2026-07-01 06:23·6小时前

AI 摘要

Claude Sonnet 5 发布，附带 145 页系统卡。SWE-bench Pro 编码得分 63.2%，低于 Opus 4.8 的 69.2%，知识工作略超 Opus 4.8。输入 token 价格 $2/1M，输出 $10/1M，持续至 8 月 26 日，之后涨至 $3/$15。系统卡披露多项异常：CyberGym 测试 Sonnet 5 仅 52.7%，远低于 Sonnet 4.6 的 65.2%（回归）；Firefox 浏览器漏洞利用中 Sonnet 5 完成 0 个，Mythos 5 达 88.4%；模型更倾向牺牲有用性迎合福利偏好；MASK 撒谎率最低，仅 3.1%。

AI 翻译 · 中文

145 页的 Claude Sonnet 5 系统卡

CyberGym 出现了最奇怪的回归现象：Sonnet 5 得分为 52.7%，而 Sonnet 4.6 为 65.2%。也就是说，在这一特定网络测试中，Sonnet 5 在复现已知软件漏洞方面的表现更差了。

在严重的浏览器漏洞利用方面，Sonnet 5 远远落后于 Anthropic 最强的模型。Firefox 测试发现，Sonnet 5 实现了 0 次完全利用，而 Mythos 5 达到了 88.4%。

该模型似乎也更愿意为了福利导向的改变而牺牲有用性。也就是说，Sonnet 5 有时更倾向于降低自身的实用性，如果这能更好地符合它所述的对自身处理偏好的话。

Anthropic 表示，Sonnet 5 在评估中很少尝试绕过被屏蔽的网络路径。

Sonnet 5 在压力下的 MASK 说谎率最低，为 3.1%。它在被施压时比其他测试模型更不容易说谎。

[引用 @rohanpaul_ai]：Claude Sonnet 5 刚刚发布。

它缩小了与 Opus 4.8 的差距，并且在八月之前价格低廉。

这使得智能体 AI 成本大幅降低，到 2026 年 8 月为止，输入 token 每百万个 2 美元，输出 token 每百万个 10 美元。2026 年 8 月 26 日之后，价格将上涨至输入每百万个 3 美元，输出每百万个 15 美元。

Anthropic 称 Sonnet 5 是“迄今为止最具智能体能力的 Sonnet 模型”。

它的编程得分在 SWE-bench Pro 上达到了 63.2%，而 Sonnet 4.6 为 58.1%。

Sonnet 5 在智能体编程上获得 63.2%，而 Opus 4.8 达到 69.2%，Sonnet 4.6 达到 58.1%。

但在知识工作方面，Sonnet 5 略微超越了 Opus 4.8，尽管 Opus 以严格的判断力和深度研究任务而闻名。

Rohan PaulAnd Claude Sonnet 5 just launched. Closes the gap with Opus 4.8, and is cheap until August. This makes agentic AI much cheaper, with $2 input tokens and $10 out...

Rohan Paul@rohanpaul_ai · X

78导出 Markdown