Slides Arena发布了基于370多万真实使用场景的Agentic Slides排行榜。Anthropic的Opus 4.7及其思考版本包揽前两名,Zai_org的GLM 5.1位列第三,共同确立了该领域的SOTA。此次评估并非实验室基准测试,而是针对软可验证、创意密集且需要完整逻辑与设计感的真实幻灯片生成场景,证实了Claude系列在智能体设计方面的领先优势。
兄弟们,这个PPT设计打榜有点意外啊! GLM5.2 居然仅次于opus4.7 啊!
Slides Arena 的结果刚刚出炉。
Design Arena 基于 370 万+ 真实创作者的真实使用场景,跑出了 Agentic Slides 的最新排行榜。
1st:Opus 4.7 by @AnthropicAI 2nd:Opus 4.7(Thinking)by @AnthropicAI 3rd:GLM 5.1 by @Zai_org
Anthropic 直接包揽前两名,Zai_org 紧随其后,把 Agentic Slides 的 SOTA 牢牢握在手里。
这不是实验室 benchmark,是真实世界里大家真正在用的幻灯片生成场景,软可验证、创意密集、需要完整逻辑和设计感。
以前大家觉得 Agentic 设计还是 Claude 的强项,现在它用真实数据把这件事彻底坐实了。
完整实时排行榜在这里:https://www.designarena.ai/leaderboard/agentic-slides