紧凑型语言模型在RAG系统中实现设备端推理,无需GPU · AI HOT