小米 MiMo:GitHub 新仓库(模型发布)
处理中
小米MiMo团队发布MiMo-V2.5-ASR语音识别模型
AI 摘要
小米MiMo团队推出端到端语音识别模型MiMo-V2.5-ASR。该模型通过大规模中期训练、高质量监督微调和新型强化学习算法,在多个维度实现显著提升:原生支持吴语、粤语等中文方言;无需语言标签即可准确转录中英文码切换内容;能高精度识别中英文歌曲歌词;在强噪声、远场等复杂声学环境下保持鲁棒性;可准确转录多人重叠对话;在知识密集型内容(如古典诗词、专业术语)识别上表现优异;并能根据韵律和语义原生生成标点,直接产出可用的转录文本。模型已在Hugging Face平台开源。
该来源未收录可展示正文,站内仅提供摘要。
阅读原文github.com