公众号:智谱(GLM)
GLM-5.1获AA全新Coding Agent基准开源第一
精选理由
GLM-5.1 在 AA 的新 Coding Agent 基准上拿了开源第一,时隔一个月回头看,这个成绩对国产开源模型在编程 Agent 赛道的位置是个重要注脚,做工具链选型的还是值得扫一眼。
AI 摘要
全球权威评测机构Artificial Analysis发布全新Coding Agent Index,包含SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA三项基准,用于衡量模型与Agent harness组合的真实编程能力。闭源模型Opus 4.7(在Cursor CLI中运行)全球第一,智谱GLM-5.1(在Claude Code中运行)获开源第一,代表国产大模型在实际编程Agent场景达到SOTA水平。
公众号正文需在微信内阅读,站内仅提供摘要。
在微信中打开原文mp.weixin.qq.com