OpenVoice ist ein Open-Source-Projekt für sofortiges Sprachklonen, das gemeinsam vom Massachusetts Institute of Technology (MIT) und MyShell entwickelt wurde. Das Projekt basiert auf einem Audio-Basismodell und ermöglicht hochwertiges, mehrsprachiges Sprachklonen und -synthese. Seit Mai 2023 bietet OpenVoice die Möglichkeit zum sofortigen Sprachklonen auf der MyShell.ai-Plattform und wurde bis November 2023 von Millionen von Nutzern weltweit verwendet.
OpenVoice basiert auf den folgenden exzellenten Open-Source-Projekten:
Zusätzlich zu den nativ unterstützten Sprachen kann OpenVoice durch Zero-Shot-Lernfähigkeiten auch Sprachklonaufgaben in anderen Sprachen bearbeiten.
# Virtuelle Umgebung erstellen
conda create -n openvoice python=3.9
conda activate openvoice
# Projekt klonen
git clone https://github.com/myshell-ai/OpenVoice.git
cd OpenVoice
# Abhängigkeiten installieren
pip install -e .
Das Projekt bietet vollständige Jupyter Notebook-Demos:
demo_part1.ipynb
: Zeigt die flexible Steuerung des Sprachstils.demo_part2.ipynb
: Demonstriert die sprachübergreifende Sprachklonfunktion.Die Forschungsergebnisse des Projekts wurden in der wissenschaftlichen Arbeit "OpenVoice: Versatile Instant Voice Cloning" veröffentlicht, die die technischen Grundlagen und experimentellen Ergebnisse detailliert erläutert.
OpenVoice repräsentiert den aktuellen Stand der Technik im Bereich des Sprachklonens und bietet durch die gemeinsame Entwicklung von MIT und MyShell Entwicklern und Forschern weltweit eine leistungsstarke, flexible und kostenlose Sprachklonlösung.