MiniMax 在开源 M2 模型半年后,系统性发布了其背后所有工作的论文,详细阐述了设计思路、训练细节与系统架构。此前,其开源系统 CISPO、Forge RL System 和 Self-Evolution 已被社区广泛采用,且多版模型发布后曾登顶 HuggingFace 排行榜。与此同时,MiniMax 官方宣布已为下一代模型 M3 做好准备,并且 MSA 论文也即将发布。
Minmax 最近沉寂了挺久~ 昨天看到应该是M3蓄势待发了
刚刚留意到MiniMax AI的动态。
他们六个月前在12月23日开源了M2模型。
这半年里,社区把他们的几个核心系统直接拿去用了:CISPO(裁剪重要性采样权重策略优化)、Forge RL System(锻造强化学习系统),还有Self-Evolution(自我进化)。
几乎每一版模型上线,都冲上Hugging Face榜首。
现在他们把M2背后的所有工作系统性整理成论文,挂到了arXiv上。
不是简单发个权重,而是把当时的设计思路、训练细节、系统架构全摊开。
这步其实挺关键。
开源社区最缺的往往不是新模型,而是能看懂为什么它能跑通的完整路径。
MiniMax Head of DevRel Ryan Lee在帖子里说,现在是时候翻开新的一章。
M3已经在路上了,MSA论文也快发布。
他们没有停在刷榜,而是把过去半年踩过的坑、验证过的方案沉淀下来,让后来人少走弯路。
这才是真正推动开源生态往前滚的做法。
兄弟们,