论文提出Self-play SWE-RL方法,通过自我博弈提升软件智能体能力 · AI HOT