GLM-5.2 魔改版让 vLLM 支持推测性解码,速度飙升至 43 token/s · AI HOT