Claude Sonnet 5 在 Artificial Analysis Intelligence Index 得分 53,与 GPT-5.5 (xhigh) 和 Opus 4.8 (max) 差 2-3 分。标准定价($3/$15 per 1M tokens)下每任务成本 $2.29,比 Sonnet 4.6 贵约 2 倍,比 Opus 4.8 贵约 15%。推理和知识密集型基准落后 Opus 4.8(如 CritPt 物理推理仅 17%),但在 agentic 知识工作(AA-Briefcase 和 GDPval-AA)上匹配或超越 Opus 4.8。上下文窗口 100 万 token,Anthropic 提供至 9 月 1 日促销价 $2/$10。新增 xhigh effort 设置。整体表现令人失望,并非一次好的发布。
tl;dr: Sonnet 5 is cheaper per token, but more expensive per solved problem - and still lags behind Opus 4.8 in overall intelligence.
Thats honestly disappointing and not a good release.