OpenAI 发布 Genebench-Pro 基准测试:10个案例研究详解 · AI HOT