Home
Login

Ein Python-Modul zur kostenlosen Nutzung des Microsoft Edge Online-Text-to-Speech-Dienstes, ohne Edge-Browser, Windows-System oder API-Schlüssel.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Edge-TTS Projekt – Detaillierte Vorstellung

Projektübersicht

Edge-TTS ist ein leistungsstarkes Python-Modul, das es Ihnen ermöglicht, den Online-Text-to-Speech-Dienst von Microsoft Edge zu nutzen, ohne den Microsoft Edge-Browser, ein Windows-System oder API-Schlüssel installieren zu müssen. Dieses Projekt bietet Entwicklern eine einfach zu bedienende Schnittstelle für den Zugriff auf den hochwertigen Sprachsynthesedienst von Microsoft.

Projektadresse

Kernfunktionen

1. Nutzung ohne Konfiguration

  • Kein Microsoft Edge-Browser erforderlich
  • Kein Windows-Betriebssystem erforderlich
  • Keine API-Schlüssel oder Kontoregistrierung erforderlich
  • Völlig kostenlose Nutzung

2. Vielfältige Nutzungsmöglichkeiten

  • Befehlszeilentools: edge-tts und edge-playback Befehle
  • Python-Modul: Direkt im Python-Code aufrufbar
  • Stapelverarbeitung: Unterstützt die Stapelverarbeitung von Text-to-Speech

3. Umfangreiche Sprachauswahl

  • Unterstützt verschiedene Sprachen und Regionen
  • Bietet männliche und weibliche Stimmen
  • Enthält verschiedene Sprachpersönlichkeiten und -stile

Installationsmethoden

Standardinstallation

pip install edge-tts

Installation mit pipx (empfohlen für Befehlszeilentools)

pipx install edge-tts

Grundlegende Nutzungsmethoden

Nutzung über die Befehlszeile

Grundlegende Text-to-Speech

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

Echtzeitwiedergabe (benötigt MPV-Player)

edge-playback --text "Hello, world!"

Auflisten aller verfügbaren Stimmen

edge-tts --list-voices

Verwendung einer bestimmten Stimme

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

Anpassung der Sprachparameter

Anpassen der Sprechgeschwindigkeit

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

Anpassen der Lautstärke

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

Anpassen der Tonhöhe

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

Unterstützte Sprachen und Regionen

Edge-TTS unterstützt zahlreiche Sprachen und regionale Varianten, einschließlich, aber nicht beschränkt auf:

  • Arabisch: Mehrere regionale Varianten (Ägypten, Vereinigte Arabische Emirate, Bahrain usw.)
  • Chinesisch: Vereinfachtes Chinesisch, Traditionelles Chinesisch usw.
  • Englisch: Amerikanisch, Britisch, Australisch usw. mit verschiedenen Akzenten
  • Französisch: Frankreich, Kanada usw.
  • Deutsch: Deutschland, Österreich usw.
  • Japanisch: Japan
  • Koreanisch: Korea
  • Spanisch: Spanien, Mexiko, Argentinien usw.
  • Andere: Einschließlich Afrikaans, Amharisch und einigen anderen Minderheitensprachen

Python-Programmierschnittstelle

Edge-TTS kann als Python-Modul direkt im Code verwendet werden und eignet sich für die Integration in verschiedene Anwendungen.

Technische Merkmale

1. Ausgabeformat

  • Audiodateien: Unterstützt MP3-Format
  • Untertiteldateien: Unterstützt SRT-Format für Untertitel zur einfachen Synchronisation

2. SSML-Unterstützung – Einschränkungen

Aufgrund der Sicherheitsbeschränkungen von Microsoft wurde die benutzerdefinierte SSML-Funktion entfernt. Der Dienst erlaubt nur die Verwendung von SSML-Formaten, die Microsoft Edge selbst generieren kann. Dies bedeutet, dass nur ein einzelnes <voice>-Tag und ein einzelnes <prosody>-Tag darin unterstützt werden.

3. Parametersteuerung

  • Geschwindigkeitssteuerung: Anpassung über den --rate-Parameter
  • Lautstärkeregelung: Anpassung über den --volume-Parameter
  • Tonhöhenregelung: Anpassung über den --pitch-Parameter

Anwendungsbereiche

1. Inhaltserstellung

  • Podcast-Produktion
  • Videosynchronisation
  • Produktion von Hörbüchern

2. Barrierefreie Anwendungen

  • Vorlesen von Webinhalten
  • Sprachausgabe von Dokumenten
  • Hilfsmittel für Sehbehinderte

3. Aus- und Weiterbildung

  • Sprachlernmaterialien
  • Synchronisation von Online-Kursen
  • Generierung von Aussprachebeispielen

4. Automatisierungsanwendungen

  • Sprachausgabe für intelligente Assistenten
  • Sprachausgabe für Benachrichtigungssysteme
  • Stapelverarbeitung von Inhalten

Verwandte Projekte

Mehrere Open-Source-Projekte verwenden das edge-tts-Modul:

  • hass-edge-tts: TTS-Integration für Home Assistant
  • Podcastfy: Podcast-Produktionstool
  • tts-samples: Projekt zur Sammlung von TTS-Sprachbeispielen

Zusammenfassung der Vorteile

  1. Völlig kostenlos: Keine Gebühren
  2. Hochwertige Sprache: Basierend auf der fortschrittlichen Sprachsynthesetechnologie von Microsoft
  3. Einfache Bedienung: Installation und Nutzung sind sehr einfach
  4. Plattformübergreifend: Unterstützt Linux, macOS, Windows
  5. Mehrsprachig: Unterstützt die wichtigsten Sprachen der Welt
  6. Open Source: Der Code ist Open Source und kann frei geändert und verteilt werden
  7. Aktive Wartung: Das Projekt wird kontinuierlich aktualisiert und gewartet

Hinweise

  1. Netzwerkabhängigkeit: Benötigt eine Internetverbindung, um auf die Online-Dienste von Microsoft zuzugreifen
  2. Wiedergabeabhängigkeit: Der Befehl edge-playback benötigt auf Nicht-Windows-Systemen die Installation des MPV-Players
  3. Dienstbeschränkungen: Unterliegt den Microsoft-Nutzungsbedingungen, es können Nutzungshäufigkeitsbeschränkungen bestehen
  4. SSML-Beschränkungen: Keine Unterstützung für komplexe SSML-Anpassungen, nur grundlegende Anpassungen der Sprachparameter sind möglich

Zusammenfassung

Edge-TTS ist ein sehr nützliches Text-to-Speech-Tool, das auf clevere Weise den Online-TTS-Dienst des Microsoft Edge-Browsers nutzt und Benutzern eine kostenlose, hochwertige Sprachsyntheselösung bietet. Sowohl für den persönlichen Gebrauch als auch für die Projektintegration ist es ein empfehlenswertes Tool. Die einfache Installation und Nutzung in Verbindung mit der umfangreichen Sprachunterstützung machen es zur idealen Wahl für Text-to-Speech-Anforderungen.