推文指出,Claude Opus 4.8相比4.7确实在各项基准测试和诚实度、长任务等方面有所进步。但对于已使用GPT-5.5、DeepSeek等其他大语言模型的用户而言,这种改进被视为常规升级,不足以构成切换模型的动力。至于未来的Opus 5是否可能,目前未知且很难。
Claude Opus 4.8 > 4.7 对,但没用
Opus 4.8 在各项 Benchmark 和诚实度、长任务等方面比 4.7 都有进步,这没错,但对于 LLM 的使用者们来说,这种进步不会产生真正的改变,只能算是 4.7 的升级而已
假设你原来就在用 Opus 4.7,那切换到 4.8 是正常的,调过提示词,benchmark 通过后就可以切。
假设你原来在用 GPT-5.5、DeepSeek 等,你会因为 Opus 4.8 的发布而切过来吗?我想是不会的,至少 4.8 不会,至于 Opus 5 会不会,不知道,也很难。