# 通义实验室发布Qwen-Image-Bench：56项细粒度创作评测基准

- 来源：公众号：通义实验室（千问）
- 作者：通义实验室
- 发布时间：2026-05-28 17:47
- AIHOT 分数：54
- AIHOT 链接：https://aihot.virxact.com/items/cmq2o71l001iwsl6n3anv6exm
- 原文链接：https://mp.weixin.qq.com/s/J3fHiF1w4NhvvnIgbDOJ3Q

## AI 摘要

通义实验室推出文生图评测基准Qwen-Image-Bench，由专业艺术家团队开发，将创作能力解构为5大核心支柱、17大场景及56项可量化维度。配套开源自动化评估模型Q-Judger，与资深人类艺术家评估相关性达Spearsman 0.92。评测使用1000条中英文分层Prompt，每条覆盖至少4项考点。结果显示，当前T2I模型在文字准确性、信息可视化、跨语言生成等子领域差距明显，世界知识与逻辑推理能力是跻身第一梯队的分水岭。完整数据集与Q-Judger已开源。

## 正文

公众号正文需在微信内阅读，站内仅提供摘要。
