OpenVoice 是由麻省理工学院(MIT)和 MyShell 联合开发的开源即时语音克隆技术项目。该项目基于音频基础模型,能够实现高质量的多语言语音克隆和合成。自2023年5月以来,OpenVoice已为MyShell.ai平台提供即时语音克隆能力,截至2023年11月,已被全球用户使用数千万次。
OpenVoice基于以下优秀开源项目构建:
除了原生支持的语言外,通过零样本学习能力,OpenVoice还可以处理其他语言的语音克隆任务。
# 创建虚拟环境
conda create -n openvoice python=3.9
conda activate openvoice
# 克隆项目
git clone https://github.com/myshell-ai/OpenVoice.git
cd OpenVoice
# 安装依赖
pip install -e .
项目提供了完整的Jupyter Notebook演示:
demo_part1.ipynb
:展示灵活的语音风格控制demo_part2.ipynb
:演示跨语言语音克隆功能项目研究成果已发表在学术论文《OpenVoice: Versatile Instant Voice Cloning》中,详细阐述了技术原理和实验结果。
OpenVoice代表了当前语音克隆技术的前沿水平,通过MIT和MyShell的联合开发,为全球开发者和研究者提供了一个强大、灵活、免费的语音克隆解决方案。