一个开源工具把 yt-dlp + Whisper + 翻译 + 声线克隆六步压缩成一条本地流水线,之前每月烧几百刀订阅费的事现在免费跑在自己机器上,做多语言视频的人可以直接换掉整套工具链。
开源项目Voice-Pro将多语言视频创作流程大幅简化。用户输入YouTube链接后,该工具可在本地自动完成视频下载、人声分离、语音转文字、翻译、声线克隆及配音合成,全程不到两分钟。它将原本需要多个付费工具协作的复杂流程,整合为一个免费、本地化的高效解决方案,显著提升了创作者的工作效率。
分享一个免费下载任何 YouTube 视频的GitHub开源项目,非常实用🔥
能做的事,放在一起看有点夸张,
输入:任意 YouTube 链接
↓ 自动下载视频 ↓ 人声分离(干净去除背景音) ↓ 语音转文字 ↓ 翻译成 100+ 种语言 ↓ 克隆原始声线 ↓ 自动配音合成
输出:完整配音视频
全程:< 2 分钟
以前这条流水线要什么,先用yt-dlp 下载,再用Audacity 分离人声,然后用Whisper 转录,再用DeepL 翻译,接着用ElevenLabs 克隆声线,最后再手动合成,
光订阅费加起来就不便宜,
Voice-Pro 把这六步压成一个本地工具,100% 跑在自己机器上,数据不出门,免费,
我觉得对做多语言内容的创作者来说,这个工作流改变挺明显的,
老规矩GitHub地址评论区自取👇