Home
Login

Module Python pour utiliser gratuitement le service de synthèse vocale en ligne de Microsoft Edge, sans navigateur Edge, système Windows ni clé API.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Présentation détaillée du projet Edge-TTS

Aperçu du projet

Edge-TTS est un module Python puissant qui vous permet d'utiliser le service de synthèse vocale en ligne de Microsoft Edge, sans avoir besoin d'installer le navigateur Microsoft Edge, le système d'exploitation Windows ou une clé API. Ce projet offre aux développeurs une interface simple et facile à utiliser pour accéder au service de synthèse vocale de haute qualité de Microsoft.

Adresse du projet

Caractéristiques principales

1. Utilisation sans configuration

  • Pas besoin du navigateur Microsoft Edge
  • Pas besoin du système d'exploitation Windows
  • Pas besoin de clé API ou d'inscription de compte
  • Utilisation entièrement gratuite

2. Multiples façons d'utilisation

  • Outil en ligne de commande: commandes edge-tts et edge-playback
  • Module Python: peut être appelé directement dans le code Python
  • Traitement par lots: prend en charge la conversion vocale de texte par lots

3. Riche sélection de voix

  • Prend en charge plusieurs langues et régions
  • Offre des options de voix masculine et féminine
  • Comprend différents personnalités et styles de voix

Méthode d'installation

Installation standard

pip install edge-tts

Installation avec pipx (recommandé pour l'outil en ligne de commande)

pipx install edge-tts

Méthode d'utilisation de base

Utilisation en ligne de commande

Conversion de texte en parole de base

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

Lecture en temps réel (nécessite le lecteur mpv)

edge-playback --text "Hello, world!"

Liste de toutes les voix disponibles

edge-tts --list-voices

Utilisation d'une voix spécifique

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

Ajustement des paramètres vocaux

Ajustement de la vitesse de la parole

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

Ajustement du volume

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

Ajustement de la tonalité

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

Langues et régions prises en charge

Edge-TTS prend en charge de nombreuses langues et variantes régionales, y compris, mais sans s'y limiter :

  • Arabe: Plusieurs variantes régionales (Égypte, Émirats arabes unis, Bahreïn, etc.)
  • Chinois: Chinois simplifié, chinois traditionnel, etc.
  • Anglais: Américain, britannique, australien, etc.
  • Français: France, Canada, etc.
  • Allemand: Allemagne, Autriche, etc.
  • Japonais: Japon
  • Coréen: Corée
  • Espagnol: Espagne, Mexique, Argentine, etc.
  • Autres: Y compris l'afrikaans, l'amharique et d'autres langues minoritaires

Interface de programmation Python

Edge-TTS peut être utilisé directement dans le code en tant que module Python, ce qui le rend adapté à l'intégration dans diverses applications.

Caractéristiques techniques

1. Format de sortie

  • Fichiers audio: Prise en charge de la sortie au format MP3
  • Fichiers de sous-titres: Prise en charge des sous-titres au format SRT pour une synchronisation facile

2. Limitations de la prise en charge de SSML

En raison des restrictions de sécurité de Microsoft, la fonctionnalité SSML personnalisée a été supprimée. Le service n'autorise que le format SSML que Microsoft Edge lui-même peut générer, ce qui signifie qu'il ne prend en charge qu'une seule balise <voice> et une seule balise <prosody> à l'intérieur.

3. Contrôle des paramètres

  • Contrôle de la vitesse de la parole: Ajustement via le paramètre --rate
  • Contrôle du volume: Ajustement via le paramètre --volume
  • Contrôle de la tonalité: Ajustement via le paramètre --pitch

Scénarios d'application

1. Création de contenu

  • Production de podcasts
  • Doublage vidéo
  • Production de livres audio

2. Applications d'accessibilité

  • Lecture de contenu Web
  • Vocalisation de documents
  • Outils d'assistance pour les personnes malvoyantes

3. Éducation et formation

  • Matériel d'apprentissage des langues
  • Doublage de cours en ligne
  • Génération d'exemples de prononciation

4. Applications d'automatisation

  • Commentaires vocaux de l'assistant intelligent
  • Diffusion vocale du système de notification
  • Traitement de contenu par lots

Projets connexes

Plusieurs projets open source utilisent le module edge-tts :

  • hass-edge-tts: Intégration TTS pour Home Assistant
  • Podcastfy: Outil de production de podcasts
  • tts-samples: Projet de collecte d'échantillons vocaux TTS

Résumé des avantages

  1. Entièrement gratuit: Aucun frais à payer
  2. Voix de haute qualité: Basé sur la technologie avancée de synthèse vocale de Microsoft
  3. Simple et facile à utiliser: L'installation et l'utilisation sont très simples
  4. Multiplateforme: Prend en charge Linux, macOS, Windows
  5. Multilingue: Prend en charge les principales langues du monde
  6. Open source: Code open source, peut être modifié et distribué librement
  7. Maintenance active: Le projet est constamment mis à jour et maintenu

Précautions

  1. Dépendance au réseau: Nécessite une connexion Internet pour accéder aux services en ligne de Microsoft
  2. Dépendance à la lecture: La commande edge-playback nécessite l'installation du lecteur mpv sur les systèmes non-Windows
  3. Limitations de service: Soumis aux conditions d'utilisation de Microsoft, il peut y avoir des limitations de fréquence d'utilisation
  4. Limitations SSML: Ne prend pas en charge la personnalisation SSML complexe, ne peut utiliser que les ajustements de paramètres vocaux de base

Conclusion

Edge-TTS est un outil de synthèse vocale très pratique qui utilise intelligemment le service TTS en ligne du navigateur Microsoft Edge, offrant aux utilisateurs une solution de synthèse vocale gratuite et de haute qualité. Que ce soit pour un usage personnel ou une intégration de projet, c'est un outil qui vaut la peine d'être recommandé. Sa simplicité d'installation et d'utilisation, associée à une riche prise en charge des langues, en fait un choix idéal pour les besoins de synthèse vocale.