Google DeepMind:Blog(RSS)
重新思考如何衡量 AI 智能
阅读原文· deepmind.googleAI 摘要
Game Arena 是新的开源平台,用于严格评估 AI 模型,支持在具备明确获胜条件的环境中对前沿系统进行一对一比较。
原文 · 保持原样,未翻译
Game Arena is a new, open-source platform for rigorous evaluation of AI models. It allows for head-to-head comparison of frontier systems in environments with clear winning conditions.