Senior SWE-Bench:评估AI智能体作为高级工程师的基准测试 · AI HOT