# 实测小米MiMo-V2.5-Pro UltraSpeed：万亿参数MoE推理模型输出速度达1000 token/s

- 来源：公众号：卡尔的AI沃茨
- 作者：卡尔的AI沃茨
- 发布时间：2026-06-10 17:00
- AIHOT 分数：65
- AIHOT 链接：https://aihot.virxact.com/items/cmq7uz2yj01xwslepv901a7k9
- 原文链接：https://mp.weixin.qq.com/s/t2YOAwnIkjhEw4gv9CNcEg

## AI 摘要

小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s，峰值达2140 token/s，是普通版的3倍，且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后，可调度12个Agent在11分钟内完成项目升级报告并打包成Skill；3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。

## 正文

公众号正文需在微信内阅读，站内仅提供摘要。
