rany2/edge-ttsPlease refer to the latest official releases for information GitHub Homepage

Module Python pour utiliser gratuitement le service de synthèse vocale en ligne de Microsoft Edge, sans navigateur Edge, système Windows ni clé API.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Présentation détaillée du projet Edge-TTS

Aperçu du projet

Edge-TTS est un module Python puissant qui vous permet d'utiliser le service de synthèse vocale en ligne de Microsoft Edge, sans avoir besoin d'installer le navigateur Microsoft Edge, le système d'exploitation Windows ou une clé API. Ce projet offre aux développeurs une interface simple et facile à utiliser pour accéder au service de synthèse vocale de haute qualité de Microsoft.

Adresse du projet

Dépôt GitHub: https://github.com/rany2/edge-tts

Caractéristiques principales

1. Utilisation sans configuration

Pas besoin du navigateur Microsoft Edge
Pas besoin du système d'exploitation Windows
Pas besoin de clé API ou d'inscription de compte
Utilisation entièrement gratuite

2. Multiples façons d'utilisation

Outil en ligne de commande: commandes edge-tts et edge-playback
Module Python: peut être appelé directement dans le code Python
Traitement par lots: prend en charge la conversion vocale de texte par lots

3. Riche sélection de voix

Prend en charge plusieurs langues et régions
Offre des options de voix masculine et féminine
Comprend différents personnalités et styles de voix

Méthode d'installation

Installation standard

pip install edge-tts

Installation avec pipx (recommandé pour l'outil en ligne de commande)

pipx install edge-tts

Méthode d'utilisation de base

Utilisation en ligne de commande

Conversion de texte en parole de base

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

Lecture en temps réel (nécessite le lecteur mpv)

edge-playback --text "Hello, world!"

Liste de toutes les voix disponibles

edge-tts --list-voices

Utilisation d'une voix spécifique

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

Ajustement des paramètres vocaux

Ajustement de la vitesse de la parole

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

Ajustement du volume

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

Ajustement de la tonalité

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

Langues et régions prises en charge

Edge-TTS prend en charge de nombreuses langues et variantes régionales, y compris, mais sans s'y limiter :

Arabe: Plusieurs variantes régionales (Égypte, Émirats arabes unis, Bahreïn, etc.)
Chinois: Chinois simplifié, chinois traditionnel, etc.
Anglais: Américain, britannique, australien, etc.
Français: France, Canada, etc.
Allemand: Allemagne, Autriche, etc.
Japonais: Japon
Coréen: Corée
Espagnol: Espagne, Mexique, Argentine, etc.
Autres: Y compris l'afrikaans, l'amharique et d'autres langues minoritaires

Interface de programmation Python

Edge-TTS peut être utilisé directement dans le code en tant que module Python, ce qui le rend adapté à l'intégration dans diverses applications.

Caractéristiques techniques

1. Format de sortie

Fichiers audio: Prise en charge de la sortie au format MP3
Fichiers de sous-titres: Prise en charge des sous-titres au format SRT pour une synchronisation facile

2. Limitations de la prise en charge de SSML

En raison des restrictions de sécurité de Microsoft, la fonctionnalité SSML personnalisée a été supprimée. Le service n'autorise que le format SSML que Microsoft Edge lui-même peut générer, ce qui signifie qu'il ne prend en charge qu'une seule balise <voice> et une seule balise <prosody> à l'intérieur.

3. Contrôle des paramètres

Contrôle de la vitesse de la parole: Ajustement via le paramètre --rate
Contrôle du volume: Ajustement via le paramètre --volume
Contrôle de la tonalité: Ajustement via le paramètre --pitch

Scénarios d'application

1. Création de contenu

Production de podcasts
Doublage vidéo
Production de livres audio

2. Applications d'accessibilité

Lecture de contenu Web
Vocalisation de documents
Outils d'assistance pour les personnes malvoyantes

3. Éducation et formation

Matériel d'apprentissage des langues
Doublage de cours en ligne
Génération d'exemples de prononciation

4. Applications d'automatisation

Commentaires vocaux de l'assistant intelligent
Diffusion vocale du système de notification
Traitement de contenu par lots

Projets connexes

Plusieurs projets open source utilisent le module edge-tts :

hass-edge-tts: Intégration TTS pour Home Assistant
Podcastfy: Outil de production de podcasts
tts-samples: Projet de collecte d'échantillons vocaux TTS

Résumé des avantages

Entièrement gratuit: Aucun frais à payer
Voix de haute qualité: Basé sur la technologie avancée de synthèse vocale de Microsoft
Simple et facile à utiliser: L'installation et l'utilisation sont très simples
Multiplateforme: Prend en charge Linux, macOS, Windows
Multilingue: Prend en charge les principales langues du monde
Open source: Code open source, peut être modifié et distribué librement
Maintenance active: Le projet est constamment mis à jour et maintenu

Précautions

Dépendance au réseau: Nécessite une connexion Internet pour accéder aux services en ligne de Microsoft
Dépendance à la lecture: La commande edge-playback nécessite l'installation du lecteur mpv sur les systèmes non-Windows
Limitations de service: Soumis aux conditions d'utilisation de Microsoft, il peut y avoir des limitations de fréquence d'utilisation
Limitations SSML: Ne prend pas en charge la personnalisation SSML complexe, ne peut utiliser que les ajustements de paramètres vocaux de base

Conclusion

Edge-TTS est un outil de synthèse vocale très pratique qui utilise intelligemment le service TTS en ligne du navigateur Microsoft Edge, offrant aux utilisateurs une solution de synthèse vocale gratuite et de haute qualité. Que ce soit pour un usage personnel ou une intégration de projet, c'est un outil qui vaut la peine d'être recommandé. Sa simplicité d'installation et d'utilisation, associée à une riche prise en charge des langues, en fait un choix idéal pour les besoins de synthèse vocale.