AA-Briefcase基准测试:开放权重模型主导成本-性能帕累托前沿 · AI HOT