GPT-SoVITS est un projet révolutionnaire de synthèse vocale (TTS) et de clonage vocal, développé et maintenu par l'équipe RVC-Boss. La caractéristique principale de ce projet est sa capacité à entraîner des modèles TTS de haute qualité avec un minimum de données vocales (seulement 1 minute au minimum), réalisant ainsi une véritable technologie de clonage vocal à partir de quelques échantillons.
Le projet est basé sur l'architecture technologique GPT et SoVITS, combinant la puissante capacité d'expression des grands modèles de langage et la technologie de synthèse vocale de haute qualité, offrant aux utilisateurs une solution complète de clonage vocal.
Le projet propose plusieurs versions pour répondre à différents besoins :
go-webui.bat
# Créer un environnement conda
conda create -n GPTSoVits python=3.10
conda activate GPTSoVits
# Installer les dépendances
bash install.sh --device <CU126|CU128|ROCM|CPU> --source <HF|HF-Mirror|ModelScope>
# Utiliser Docker Compose
docker compose run --service-ports GPT-SoVITS-CU128
Le projet GPT-SoVITS représente une avancée importante dans la technologie de clonage vocal, démocratisant la technologie de synthèse vocale de haute qualité, permettant aux utilisateurs ordinaires de créer facilement des modèles vocaux personnalisés. La nature open source du projet favorise le développement rapide et l'application généralisée de la technologie, apportant de nouvelles possibilités au domaine de l'IA vocale.