# Opus 4.7性能争议：评估提升与用户感受存差异

- 来源：swyx 🇸🇬 (@swyx)
- 发布时间：2026-05-05 04:39
- AIHOT 分数：61
- AIHOT 链接：https://aihot.virxact.com/items/cmorokayk014xslrjpro40nr5
- 原文链接：https://x.com/swyx/status/2051401321744605450

## AI 摘要

看到很多人说Opus 4.7相比4.6是净退步，但这似乎只是些个例。

离线和在线评估都指向明确的进步。

那是什么没被捕捉到呢？“个性”吗？

## 正文

seeing lot of people saying that Opus 4.7 is a net regression vs 4.6， but it seems quite anecdotal.

offline and online evals point towards a clean step up.

what's not being captured？ "personality"？
