OpenVoice 是由麻省理工學院(MIT)和 MyShell 聯合開發的開源即時語音克隆技術項目。該項目基於音訊基礎模型,能夠實現高品質的多語言語音克隆和合成。自 2023 年 5 月以來,OpenVoice 已為 MyShell.ai 平台提供即時語音克隆能力,截至 2023 年 11 月,已被全球用戶使用數千萬次。
OpenVoice 基於以下優秀開源項目構建:
除了原生支持的語言外,通過零樣本學習能力,OpenVoice 還可以處理其他語言的語音克隆任務。
# 創建虛擬環境
conda create -n openvoice python=3.9
conda activate openvoice
# 克隆項目
git clone https://github.com/myshell-ai/OpenVoice.git
cd OpenVoice
# 安裝依賴
pip install -e .
項目提供了完整的 Jupyter Notebook 演示:
demo_part1.ipynb
:展示靈活的語音風格控制demo_part2.ipynb
:演示跨語言語音克隆功能項目研究成果已發表在學術論文《OpenVoice: Versatile Instant Voice Cloning》中,詳細闡述了技術原理和實驗結果。
OpenVoice 代表了當前語音克隆技術的前沿水平,通過 MIT 和 MyShell 的聯合開發,為全球開發者和研究者提供了一個強大、靈活、免費的語音克隆解決方案。