# Stability AI 推出音频模型 Stability Audio 3.0，可生成最长 6 分钟专业级歌曲

- 来源：IT之家（RSS）
- 发布时间：2026-05-20 23:42
- AIHOT 分数：71
- AIHOT 标记：精选
- AIHOT 链接：https://aihot.virxact.com/items/cmpe8vto10ah2slk1zwrd61c2
- 原文链接：https://www.ithome.com/0/953/086.htm

## 精选理由

Stability Audio 3.0 把AI音乐从几十秒的demo拉到了六分钟的完整歌曲，而且中小模型直接开源，任何一个能跑模型的设备都能玩，音乐创作的门槛继续被踩低。

## AI 摘要

Stability AI 推出 Stability Audio 3.0 音频生成模型家族，包含四款不同规格模型，参数从45900万到27亿。小型模型专注设备端运行，可本地生成两分钟以内的音频；中型和大型模型支持创作超过6分20秒的完整音乐，

## 正文

IT之家 5 月 20 日消息，据外媒 TechCrunch 今晚报道，AI 初创公司 Stability AI 推出全新音频生成模型家族 Stability Audio 3.0，其顶级版本据称可生成长达六分钟以上的专业级音乐。

Stability AI 此次共推出了四款不同规格的模型，分别为：45900 万参数的小型 XFS 与小型版、14 亿参数的中型版，以及 27 亿参数的大型版。其中，两款小型模型专注于设备端运行，可本地生成两分钟以内的声音与音乐。

中型和大型模型则展现出更强的架构控制力，能够创作长达 6 分钟 20 秒的完整乐曲，并精准维持音乐结构与旋律基调。这一长度与 2024 年该公司推出的 Stable Audio 2.0 相比，实现了翻倍以上的跨越。

为了回馈开源社区，Stability AI 已将小型 SFX、小型及中型模型开源，公众可以自由下载并修改权重。不过，最顶尖的大型模型目前仅通过 API 与付费托管服务提供，且年营收超过 100 万美元（IT之家注：现汇率约合 682.1 万元人民币）的企业必须购买商业授权。

为了规避合规风险，Stability AI 在去年就已同华纳音乐集团、环球音乐集团达成深度合作。该公司强调，此次推出的最新音频模型全量基于合法授权的数据集训练而成。

Stability AI 目前正紧锣密鼓地为专业音乐人打造一套全新产品线，不过尚未公布具体功能细节。为了推进该项目，曾先后担任环球音频与芬达首席数字官的伊桑 · 卡普兰已正式加盟，负责领衔专业音乐产品业务。