jianchang512/ChatTTS-ui

ChatTTS-ui : une interface web locale simple qui utilise ChatTTS pour synthétiser du texte en parole, tout en prenant en charge la fourniture d'une interface API externe.

NOASSERTIONPython 7.1kjianchang512 Last Updated: 2025-04-21

https://github.com/jianchang512/ChatTTS-ui

Présentation détaillée du projet ChatTTS-ui

Aperçu du projet

ChatTTS-ui est un projet d'interface web locale simple basé sur ChatTTS, créé et maintenu par le développeur jianchang512. Ce projet offre aux utilisateurs une interface web conviviale pour utiliser ChatTTS pour la synthèse vocale, tout en fournissant des interfaces API complètes pour les appels externes.

Adresse du projet: https://github.com/jianchang512/ChatTTS-ui

Description du projet: Une interface web locale simple qui utilise ChatTTS pour synthétiser du texte en parole, tout en prenant en charge la fourniture d'interfaces API externes.

Fonctionnalités/Caractéristiques principales

🎯 Fonctionnalités principales

Synthèse vocale: Prend en charge la conversion de texte mixte (chinois, anglais, chiffres, symboles, etc.) en parole naturelle et fluide.
Prise en charge de plusieurs voix: Offre une variété de voix prédéfinies, permettant aux utilisateurs de choisir différents styles de voix selon leurs besoins.
Interface web: Fournit une interface d'opération web locale simple et intuitive, utilisable sans configuration complexe.
Interface API: Interfaces API RESTful complètes, faciles à intégrer dans d'autres applications.
Prise en charge multiplateforme: Prend en charge plusieurs systèmes d'exploitation tels que Windows, Linux, macOS.

🚀 Caractéristiques techniques

Accélération GPU: Prend en charge l'accélération GPU NVIDIA CUDA et AMD ROCm, améliorant la vitesse de la synthèse vocale.
Déploiement Docker: Fournit une solution de déploiement conteneurisée Docker, simplifiant le processus de déploiement.
Plusieurs méthodes d'installation: Prend en charge plusieurs méthodes d'installation telles que les packages précompilés, le déploiement à partir du code source, Docker, etc.
Personnalisation de la voix: Prend en charge la personnalisation des valeurs de départ de la voix pour générer des voix personnalisées.
Prise en charge des caractères de contrôle: Prend en charge les caractères de contrôle de la parole tels que les rires, les pauses, etc., améliorant l'effet d'expression.

📋 Langues et formats pris en charge

Prise en charge des langues: Chinois, anglais et mélange de chinois et d'anglais.
Format de sortie: Fichier audio WAV.
Traitement du texte: Prend en charge le contenu textuel complexe tel que les chiffres, les symboles, les caractères de contrôle, etc.

Méthodes de déploiement

1. Déploiement du package précompilé (recommandé aux débutants)

Téléchargez le package compressé depuis la page Releases.
Décompressez-le et exécutez directement app.exe.
Ouvrez automatiquement le navigateur et accédez à http://127.0.0.1:9966

2. Déploiement Docker

# Version GPU
docker compose -f docker-compose.gpu.yaml up -d

# Version CPU
docker compose -f docker-compose.cpu.yaml up -d

3. Déploiement à partir du code source

# Cloner le projet
git clone https://github.com/jianchang512/ChatTTS-ui.git

# Créer un environnement virtuel
python3 -m venv venv
source ./venv/bin/activate

# Installer les dépendances
pip3 install -r requirements.txt

# Démarrer le service
python3 app.py

Configuration système requise

Configuration matérielle requise

Mémoire: 4 Go ou plus recommandé.
Carte graphique: Carte graphique NVIDIA avec 4 Go de mémoire vidéo ou plus (facultatif, pour l'accélération GPU).
Stockage: Au moins 2 Go d'espace disponible (pour les fichiers de modèle).

Environnement logiciel

Python: Version 3.9-3.11.
Système d'exploitation: Windows 10+, Linux, macOS.
Dépendances: FFmpeg (doit être installé).
CUDA: 11.8+ (accélération GPU facultative).

Scénarios d'application

🎭 Création de contenu

Doublage vidéo et production de voix off.
Génération de podcasts et de contenu audio.
Synthèse vocale de matériel de formation pédagogique.

🤖 Intégration de développement

Réponses vocales de chatbot.
Diffusion vocale de service client intelligent.
Invites vocales d'application.

📢 Applications commerciales

Doublage de publicités et de bandes-annonces.
Navigation vocale du système téléphonique.
Présentation multimédia vocale.

Avantages du projet

Facile à utiliser: Fournit une interface web intuitive, ne nécessitant pas de connaissances techniques spécialisées.
Déploiement simple: Plusieurs méthodes de déploiement, adaptées aux utilisateurs de différents niveaux techniques.
Performances excellentes: Prend en charge l'accélération GPU, la vitesse de synthèse vocale est rapide.
Open source et gratuit: Entièrement open source, peut être utilisé et modifié librement.
Maintenance active: Mises à jour et corrections de bugs continues, bon support communautaire.
API complète: Fournit des interfaces API complètes, facilitant le développement d'intégration.

Conclusion

ChatTTS-ui est une solution de synthèse vocale complète et facile à utiliser. Il emballe le puissant modèle ChatTTS dans une interface conviviale, offrant aux utilisateurs individuels et aux développeurs un outil de synthèse vocale pratique. Que ce soit pour la création de contenu, le développement d'applications ou les applications commerciales, vous pouvez trouver des scénarios d'utilisation appropriés.