SpecBench:测量长期编码代理中的奖励黑客行为 · AI HOT