OpenAI 低调收购声音克隆平台 Weights.gg,整合 AI 语音技术并应对版权争议
阅读原文· ithome.comOpenAI 于今年早些时候低调收购了AI声音克隆初创公司Weights.gg,获得了其全部知识产权和约六人团队。Weights.gg的平台允许用户创建AI语音翻唱和进行文本转语音,其社区模型库包含大量未经授权的名人声音模型。OpenAI自身已开发出仅需15秒音频即可克隆语音的Voice Engine技术,但因滥用担忧尚未广泛开放。公司正将语音技术整合进商业化产品,并调整业务以聚焦创收。此次收购也使其更深地卷入声音克隆技术引发的版权争议之中。
IT之家 5 月 16 日消息,据《纽约时报》报道,OpenAI 已于今年早些时候低调收购了一家专注于 AI 声音克隆技术的小型初创公司 Weights.gg,涵盖其全部知识产权及一支约六人的团队,具体交易条款尚未对外公布。Weights.gg 已于今年 3 月宣布关停其服务。
Weights.gg 运营着一个面向 AI 爱好者和内容创作者的在线平台,用户可通过其免费应用程序 Replay 创建 AI 语音翻唱、进行文本转语音操作,并使用基于 RVC 技术的社区语音模型库。该平台的语音模型库中包含大量未经授权的名人声音克隆模型,包括泰勒 · 斯威夫特(Taylor Swift)、坎耶 · 维斯特(Kanye West)、Blackpink 成员,以及动画角色兔八哥(Bugs Bunny)和达菲鸭(Daffy Duck)等,甚至还包括大量美国政坛人物。
据 PitchBook 统计,Weights.gg 此前累计获得约 400 万美元(IT之家注:现汇率约合 2729.1 万元人民币)的风险投资,投资方包括 Freestyle Capital、Kleiner Perkins 和 Original Capital。
OpenAI 在声音克隆领域已有多项布局。早在 2022 年底,该公司便开始了 Voice Engine 技术的开发,并于 2024 年 3 月进行了小规模预览。该技术仅需 15 秒的音频样本即可生成与原说话人极为相似的自然语音。出于对技术被滥用的担忧,尤其是在选举年可能引发的风险,OpenAI 至今未向公众开放此项服务,仅向少数合作伙伴提供有限访问权限。
与此同时,OpenAI 正逐步将语音技术整合到商业化产品中。本月,该公司向第三方开发者开放了语音技术的 API 接口,允许开发者将其集成到外部应用和服务中,应用场景包括实时语音翻译和语音命令交互。OpenAI 还将 ChatGPT 集成到苹果 CarPlay 中,用户可在驾驶时通过语音与聊天机器人交互。