karminski-牙医@karminski3

2026-06-01 20:49·31天前

AI 摘要

Qwen3.7-Max实测显示其前端测试能力较3.6版本有显著进步。后端能力测试在34个参与模型中表现突出，以6947分登顶，远超此前GPT-5.5-Pro（xhigh）的4000分，且是唯一实现IVF-PQ + ADC索引方案的模型。测试也指出其输出分布稳定性有待提升，建议使用中多加review代码。此外，其Agent能力已达到第一梯队水平，并可实际用于构建AI磁盘恢复系统等工程任务。

给大家带来 Qwen3.7-Max 实测！

这次使用了全新的前端测试集，直接说结论， Qwen3.7-Max 应该是之前测试过的版本中进步特别大的一个，甚至这次前端测试能完成之前3.6版本不能完成的测试项目.

而且后端能力测试直接刷了个榜一！它是参与测试的34个模型中唯一一个实现了 IVF-PQ + ADC 索引方案的模型！直接把后端测试从之前 GPT-5.5-Pro（xhigh）的4000分拉到了现在的6947分！

不过需要注意的是，它的测试表现分布并不是很稳定，所以建议使用中要多review代码，来达成更高的输出质量.

另外，本次 Agent 能力也有提升，达到了第一梯队的水平.

最后，我还用 Qwen3.7-Max 实现了一个基于AI的磁盘恢复系统，用来测试模型的实际工程能力. 编写过程很顺畅，没有遇到阻碍，大家可以直接看视频里的效果.

#qwen #阿里千问 #qwen37max #AIAgent