# Claude Fable 5 在 APEX-SWE 评测中夺冠，Observability 类别首破 50%

- 来源：Nathan Lambert (@natolambert)
- 发布时间：2026-06-10 01:56
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmq6yi08700s6slbhxx9vpdv0
- 原文链接：https://x.com/natolambert/status/2064406209294397944

## AI 摘要

Claude Fable 5 在 APEX-SWE 软件工程评测中取得 65.5% Pass@1 总体成绩，较 Claude Opus 4.8 高约 18 个百分点。两个子类别中，Integration 为 61.3%，Observability 高达 69.7%，后者比 Opus 4.8 领先 26 个百分点。Fable 5 是首个在 Observability 类别突破 50% 的模型，也是唯一在该项上得分高于 Integration 的模型（其他模型均相反）。Observability 此前一直是所有模型的瓶颈，Fable 5 首次打破这一局面。主推文认为，虽然模型 token 价格不菲，但对大量企业而言物有所值。

## 正文

A crazy jump. The price of the tokens will be worth it to a vast number of enterprises.

### 引用推文

> Mercor：Claude Fable 5 takes #1 on APEX-SWE: 65.5% Pass@1 overall. It scores ~18pp higher than Opus 4.8. We tested @claudeai Fable 5 on APEX-SWE which measures whether ...
