AI 摘要
最后终于跟 @LambdaAPI 合作发布了! MiniMax 公布新模型卡 M3,参数量超过 400B,使用未量化权重需要整台 HGX B200(且认为无法在 Hopper 上运行 MXFP4)。在性能之外,多模态能力也是一大亮点 😍
Finallyyy with @LambdaAPI
New model card up, @MiniMax_AI M3! (Working through the Colorado backlog) At 400B+ parameters, using the unquantized weights ends up needing a full HGX B200 (an...