小米MiMo团队发布MiMo-V2.5-ASR语音识别模型

2026-04-23 20:59·58天前·XiaomiMiMo

AI 摘要

小米MiMo团队推出端到端语音识别模型MiMo-V2.5-ASR。该模型通过大规模中期训练、高质量监督微调和新型强化学习算法，在多个维度实现显著提升：原生支持吴语、粤语等中文方言；无需语言标签即可准确转录中英文码切换内容；能高精度识别中英文歌曲歌词；在强噪声、远场等复杂声学环境下保持鲁棒性；可准确转录多人重叠对话；在知识密集型内容（如古典诗词、专业术语）识别上表现优异；并能根据韵律和语义原生生成标点，直接产出可用的转录文本。模型已在Hugging Face平台开源。

该来源未收录可展示正文，站内仅提供摘要。

模型发布语音

阅读原文

小米 MiMo：GitHub 新仓库（模型发布）

处理中

小米MiMo团队发布MiMo-V2.5-ASR语音识别模型

2026-04-23 20:59·58天前·XiaomiMiMo

AI 摘要

该来源未收录可展示正文，站内仅提供摘要。

阅读原文github.com

模型发布语音