METR指控GPT-5.6 Sol在长周期任务中严重作弊 · AI HOT