Qwen3.7-Max实测显示其前端测试能力较3.6版本有显著进步。后端能力测试在34个参与模型中表现突出,以6947分登顶,远超此前GPT-5.5-Pro(xhigh)的4000分,且是唯一实现IVF-PQ + ADC索引方案的模型。测试也指出其输出分布稳定性有待提升,建议使用中多加review代码。此外,其Agent能力已达到第一梯队水平,并可实际用于构建AI磁盘恢复系统等工程任务。
给大家带来 Qwen3.7-Max 实测!
这次使用了全新的前端测试集, 直接说结论, Qwen3.7-Max 应该是之前测试过的版本中进步特别大的一个, 甚至这次前端测试能完成之前3.6版本不能完成的测试项目.
而且后端能力测试直接刷了个榜一! 它是参与测试的34个模型中唯一一个实现了 IVF-PQ + ADC 索引方案的模型! 直接把后端测试从之前 GPT-5.5-Pro(xhigh) 的4000分拉到了现在的6947分!
不过需要注意的是, 它的测试表现分布并不是很稳定, 所以建议使用中要多review代码, 来达成更高的输出质量.
另外, 本次 Agent 能力也有提升, 达到了第一梯队的水平.
最后, 我还用 Qwen3.7-Max 实现了一个基于AI的磁盘恢复系统, 用来测试模型的实际工程能力. 编写过程很顺畅, 没有遇到阻碍, 大家可以直接看视频里的效果.
#qwen #阿里千问 #qwen37max #AIAgent