# MiMo推出V2.5 Pro UltraSpeed超高速模型，每秒输出超1000 Token

- 来源：歸藏(guizang.ai) (@op7418)
- 发布时间：2026-06-09 16:05
- AIHOT 分数：63
- AIHOT 链接：https://aihot.virxact.com/items/cmq6daoyr07e1sl5i3vjlx9kb
- 原文链接：https://x.com/op7418/status/2064257622803710463

## AI 摘要

MiMo推出V2.5 Pro UltraSpeed超高速模型版本，每秒输出超1000 Token，号称全球首个达此速度的万亿参数模型。实测显示：复杂3D小游戏TPS 804 Token/s（峰值810），首次响应4.71秒；官网3D动画峰值1426 Token/s，首次响应0.83秒，32秒输出25624 Token（1000行代码）；另一复杂官网3D效果TPS 1136，首次响应4.5秒。相比此前超高速推理方案常见能力下降，MiMo未出现此类迹象。该模型主要面向效率要求极高的ToB客户，在Agent和Sub-Agent并发场景下效率提升明显。

## 正文

MiMo推出1000 Token/s超高速模型|体验测评

MiMo 推出了 MiMo V2.5 Pro UltraSpeed 超高速的模型版本，能够实现每秒输出超过 1，000 Token 的速度。

同时，这应该也是全球第一个达到这个速度的万亿（1T）参数模型。

藏师傅提前试了一下，做了三个测试，确实爽。

第一个跑了一个比较复杂的 3D 采矿小游戏测试。在没有素材的情况下，我让它全部用 Three.js 前端代码来生成素材。整体要求比较完整，虽然第一次实践时出了一些小问题，但在跟他沟通修改建议后，非常完美地实现了任务。
这次测试的各项指标如下：思考的 TPS：804 Token/s，峰值速度：810 Token/s，首次响应时间：4.71 秒。

第二个测试给了一个官网，其头部包含一个相对复杂的 3D 动画。
这次的输出速度快了非常多：峰值达到了 1426 Token/s，首次响应只用了 0.83 秒，在 32 秒内输出了 25624 个 Token，总计生成了 1000 行代码。

第三个测试给了一个更复杂的官网。我要求这个官网的 Header 头部包含以下 3D 效果：地球边缘、轨道上的飞船、星际尘埃、航线图、舷窗的 HUD 样式。
这个效果非常好，整体的视觉样式、状态、SVG 动画和驾驶卡片都非常精细，还有滚动的视差效果

这个输出的 TPS 达到了 1136 tokens/s，首次响应是 4.5 秒

官方测试平台下面有个数据展示，会显示相关信息

在流式输出的情况下，当你看着它只用 20 秒就产生一个非常复杂的 3D 游戏时，那种场景还是比较震撼的

之前的这些（比如说 Groq 之类的）超高速推理方案，在模型能力或者是整体水平上都会有所下降，但是 MiMo 这个在测试的时候，我没有看到这种迹象

最近很多公司都开始推出这种超高速的 API 服务，比如之前 OpenAI 和 Anthropic 都有 Fast 模式

在 Agent 场景下，模型输出效率的提升会直接带动每一步 Agent 操作的效率：

如果一个任务预估一分钟完成，你就会盯着它直到结束，然后立刻投入测试。如果需要五分钟才完成，你可能就会去干别的事，然后再回来看，难免会浪费一些时间

这种效率提升在 Sub-Agent 和并发场景下更加明显。因为它可以更快地产出大量结果，想象一下，如果同时启动一两百个 Sub-Agent，在模型能力没有衰减的前提下，速度提高 10 倍，体验是非常爽的

毕竟这本质上是面向那种对效率有极高要求的 To B 客户所推出的

希望后面大家卷起来，优化一下成本，让普通用户也能放开用这种 UltraSpeed 模型
