DeepSWE 基准测试发布,GLM-5.2 与 Kimi-K2.7-Code 分别成为国产编程 SOTA 与性价比 S · AI HOT