公众号:卡尔的AI沃茨
实测小米MiMo-V2.5-Pro UltraSpeed:万亿参数MoE推理模型输出速度达1000 token/s
AI 摘要
小米MiMo-V2.5-Pro UltraSpeed模式在单8卡节点上实现万亿参数MoE推理模型输出速度1000 token/s,峰值达2140 token/s,是普通版的3倍,且此前已降价99%。接入Claude Code桌面端开启UltraCode模式后,可调度12个Agent在11分钟内完成项目升级报告并打包成Skill;3分钟内生成含灯光、剪影、星光特效的3D吉他英雄网页。技术层面通过FP4混合量化、提前草稿机制及计算/搬数据/通信流水线调度实现高速推理。
公众号正文需在微信内阅读,站内仅提供摘要。
在微信中打开原文mp.weixin.qq.com