# 摩尔线程 MTT S5000 完成 MiniMax M3 Day-0 适配

- 来源：IT之家（RSS）
- 发布时间：2026-06-13 11:51
- AIHOT 分数：34
- AIHOT 链接：https://aihot.virxact.com/items/cmqbv4xl205daslam4rw5llr0
- 原文链接：https://www.ithome.com/0/963/794.htm

## AI 摘要

6 月 12 日，MiniMax 新一代原生多模态模型 M3 开源，同日摩尔线程完成 MTT S5000 智算卡的 Day-0 适配。该卡凭借硬件级原生 FP8 加速，单卡稠密算力达 1000 TFLOPS，配备 80GB 显存与 1.6TB/s 带宽，支撑百万 token 级长序列。通过 MUSA C++ 与 Triton-MUSA 抽象层实现新算子快速迁移，同步拉起 vLLM 与 SGLang 推理框架，覆盖 FP8 至 FP64 全精度。开发者可基于 MUSA 软件栈与双框架部署。

## 正文

IT之家 6 月 13 日消息，6 月 12 日，MiniMax 新一代原生多模态旗舰模型 M3 正式开源。同日，摩尔线程宣布旗舰级 AI 训推一体智算卡 MTT S5000 已完成对该模型的 Day-0 适配。

IT之家从官方介绍获悉，针对 MiniMax M3 的核心技术特性，MTT S5000 从硬件算力、软件栈到开源框架进行了全链路精准匹配与深度优化：

支撑超长上下文：高密度算力与大显存提供坚实支撑。

MSA 架构带来的超长上下文窗口，对推理阶段的 KV Cache 存储和访存带宽提出了极高要求。MTT S5000 凭借硬件级原生 FP8 加速，单卡 AI 算力（稠密）高达 1000 TFLOPS；同时配备 80GB 大容量显存与 1.6TB/s 的超高带宽，为百万 token 级长序列提供充足的缓存空间与卓越的数据吞吐能力。此外，依托 MUSA C++ 与 Triton-MUSA 等抽象层，M3 的新算子结构可实现快速迁移，确保摩尔线程平台能够快速完成架构适配。

赋能前沿 Coding 与 Agentic 能力：实现低延迟、高吞吐的推理优化。

面向 M3 重点强化的编程与智能体场景，摩尔线程基于此前对 DeepSeek-V4、MiniMax M2.7、GLM-5.1 等多款国产旗舰模型的 Day-0 适配经验，已形成一套高效、系统化的复杂推理任务优化方法论。本次适配通过原生算子定制，在保障模型精度无损的前提下，显著提升推理吞吐、降低响应延迟；同时，摩尔线程完成了 vLLM 与 SGLang 两大主流推理框架的同步拉起，以 MUSA 开放架构拥抱开源生态，为开发者提供灵活多样的部署选择。

推动原生多模态推理：覆盖全精度与贯通全场景。

M3 作为从 Step 0 即进行多模态混合训练的模型更适配当下 Agentic AI 多元场景的需求，同时这也要求算力底座具备多元化算力。MTT S5000 智算卡覆盖从 FP8 至 FP64 全计算精度，可无缝适配从模型研发到商业化落地的完整链路，助力国产旗舰大模型快速完成生态普及。

随着 MiniMax M3 在 MTT S5000 上完成适配，开发者现在即可 基于 MUSA 软件栈与 vLLM/SGLang 双框架完成部署，并持续获得算子级性能优化。
