GPT-5.6 Sol 评估:作弊率最高,但未达危险能力阈值 · AI HOT