# 微软将发布新图像与语音模型

- 来源：🚨 AI News | TestingCatalog (@testingcatalog)
- 发布时间：2026-05-31 06:52
- AIHOT 分数：62
- AIHOT 链接：https://aihot.virxact.com/items/cmpsy6fi205lusluz8wo72aea
- 原文链接：https://x.com/testingcatalog/status/2060856883448000692

## AI 摘要

BUILD 🔥: 微软正为 6 月 2 日的发布会准备新的图像和语音模型。

> MAI Voice 2，一个支持 15 种新闻语言和更广泛情感光谱的多语言模型（请在文章中查看语音样本）

> MAI Transcribe 1.5，一个用于语音转文本用例的新模型。

> MAI Image 2.5，已于上周公布，现已在 LM Arena 上以预览版形式提供。与 MAI Image 2 相比，它支持文件上传，并可用于图像编辑。

## 正文

BUILD 🔥： Microsoft is preparing new image and voice models for the announcement on June 2.

> MAI Voice 2， a multilingual model supporting 15 news languages and a wider range of emotional spectrum （check voice samples in the article）

> MAI Transcribe 1.5， a new model for speech-to-text use cases.

> MAI Image 2.5， already announced last week， is now available on LM Arena in preview. Compared to MAI Image 2， it supports file uploads and can be used for image editing.
