重新思考推理 SFT 中的泛化:基于优化、数据与模型能力的条件分析 · AI HOT