阿里千问最强智能体模型 Qwen3.7-Max 发布
阅读原文· ithome.com阿里云千问大模型今日正式发布新一代旗舰智能体模型 Qwen3.7-Max,定位为全能的智能体基座。该模型在编程、办公自动化及长周期自主任务方面能力突出,其中在一项持续35小时、超过1000次工具调用的内核优化实验中验证了其稳定的推理与执行能力。基准测试显示,Qwen3.7-Max 在 SWE-Pro、MCP-Mark、GPQA Diamond 等多项评测中成绩领先,其编程、通用智能体及推理能力已达到业界顶尖水平。该模型即将通过阿里云百炼 API 提供服务。
IT之家 5 月 20 日消息,阿里千问大模型今日正式发布 Qwen3.7-Max —— 面向智能体时代的新一代旗舰模型,即将通过 API 提供服务。Qwen3.7-Max 是阿里千问迄今最全面、最强大的智能体模型。
千问大模型官方介绍称,Qwen3.7-Max 致力于成为全能的智能体基座 —— 无论是编写和调试代码、自动化办公流程,还是在跨越数百乃至数千步的长周期任务中持续自主执行,都能胜任。
Qwen3.7-Max 的核心优势在于智能体能力的广度与深度:
编程方面,从前端原型开发到复杂的多文件工程均能驾驭;
办公与生产力方面,通过 MCP 集成和多智能体协作实现工作流自动化;
长周期自主执行方面,在一项长达 35 小时、超过 1000 次工具调用的全自主内核优化实验中保持了连贯推理,验证了其持久稳定的执行能力;
此外,无论部署在 Claude Code、OpenClaw、Qwen Code 还是其他框架下,都能稳定发挥出色的跨框架泛化能力。
Qwen3.7-Max 即将通过阿里云百炼提供服务,用户可以通过阿里云百炼 API 调用(即将上线)。
IT之家附 Qwen3.7-Max 模型测试表现如下:
在编程智能体方面,Qwen3.7-Max 在 SWE-Pro(60.6)、SWE-Multilingual(78.3)、SciCode(53.5)和 QwenSVG(1608)上均取得领先表现。在 Terminal Bench 2.0-Terminus(69.7)上超越 DS-V4-Pro Max(67.9)。在 SWE-Verified(80.4)上与 Opus-4.6 Max(80.8)和 DS-V4-Pro Max(80.6)表现相当。