# VoxCPM2：2B开源语音编辑模型，声音可像滤镜一样调整

- 来源：OpenBMB (@OpenBMB)
- 发布时间：2026-07-01 14:38
- AIHOT 分数：55
- AIHOT 链接：https://aihot.virxact.com/items/cmr1pj1g600w2sl8zm05hbfun
- 原文链接：https://x.com/OpenBMB/status/2072208077596787155

## AI 摘要

面壁智能发布VoxCPM2，一个2B参数的开源语音模型，支持30种语言及9种方言。该模型实现“声音可编辑”：通过提示词指定年龄、音色、情绪和语速，也可上传参考音频保留原音色并重新控制表达方式。实测显示，语音生成已从单纯模仿真人转向按需导演级表演，让声音变得像图片滤镜一样可描述、复制和改写。

## 正文

Big thanks for this fantastic share and hands-on testing of VoxCPM2！ 👍
Voice is becoming editable - that's the shift we're driving. With VoxCPM2， you get Voice Design + Controllable Cloning， 30 languages &amp； 9 dialects， all in a 2B open-source model.
https://github.com/OpenBMB/VoxCPM

### 引用推文

> Vincent | 信号>噪音：本地跑了一遍 VoxCPM2,最让我意外的不是它会说粤语、河南话,而是"声音"正在变成一种可以编辑的东西。 写一句提示词,就能指定年龄、音色、情绪和语速;再上传一段参考音频,它还能保留音色,重新控制表达方式。 以前语音模型追求的是"像不像本人",现在已经开始解决"能不能按导演要求表演"。 当声音可以像图片滤镜一样被描述...