rany2/edge-ttsPlease refer to the latest official releases for information GitHub Homepage

Ein Python-Modul zur kostenlosen Nutzung des Microsoft Edge Online-Text-to-Speech-Dienstes, ohne Edge-Browser, Windows-System oder API-Schlüssel.

LGPL-3.0Python 8.4krany2 Last Updated: 2025-05-03

Edge-TTS Projekt – Detaillierte Vorstellung

Projektübersicht

Edge-TTS ist ein leistungsstarkes Python-Modul, das es Ihnen ermöglicht, den Online-Text-to-Speech-Dienst von Microsoft Edge zu nutzen, ohne den Microsoft Edge-Browser, ein Windows-System oder API-Schlüssel installieren zu müssen. Dieses Projekt bietet Entwicklern eine einfach zu bedienende Schnittstelle für den Zugriff auf den hochwertigen Sprachsynthesedienst von Microsoft.

Projektadresse

GitHub-Repository: https://github.com/rany2/edge-tts

Kernfunktionen

1. Nutzung ohne Konfiguration

Kein Microsoft Edge-Browser erforderlich
Kein Windows-Betriebssystem erforderlich
Keine API-Schlüssel oder Kontoregistrierung erforderlich
Völlig kostenlose Nutzung

2. Vielfältige Nutzungsmöglichkeiten

Befehlszeilentools: edge-tts und edge-playback Befehle
Python-Modul: Direkt im Python-Code aufrufbar
Stapelverarbeitung: Unterstützt die Stapelverarbeitung von Text-to-Speech

3. Umfangreiche Sprachauswahl

Unterstützt verschiedene Sprachen und Regionen
Bietet männliche und weibliche Stimmen
Enthält verschiedene Sprachpersönlichkeiten und -stile

Installationsmethoden

Standardinstallation

pip install edge-tts

Installation mit pipx (empfohlen für Befehlszeilentools)

pipx install edge-tts

Grundlegende Nutzungsmethoden

Nutzung über die Befehlszeile

Grundlegende Text-to-Speech

edge-tts --text "Hello, world!" --write-media hello.mp3 --write-subtitles hello.srt

Echtzeitwiedergabe (benötigt MPV-Player)

edge-playback --text "Hello, world!"

Auflisten aller verfügbaren Stimmen

edge-tts --list-voices

Verwendung einer bestimmten Stimme

edge-tts --voice ar-EG-SalmaNeural --text "مرحبا كيف حالك؟" --write-media hello_in_arabic.mp3

Anpassung der Sprachparameter

Anpassen der Sprechgeschwindigkeit

edge-tts --rate=-50% --text "Hello, world!" --write-media hello_slow.mp3

Anpassen der Lautstärke

edge-tts --volume=-50% --text "Hello, world!" --write-media hello_quiet.mp3

Anpassen der Tonhöhe

edge-tts --pitch=-50Hz --text "Hello, world!" --write-media hello_low_pitch.mp3

Unterstützte Sprachen und Regionen

Edge-TTS unterstützt zahlreiche Sprachen und regionale Varianten, einschließlich, aber nicht beschränkt auf:

Arabisch: Mehrere regionale Varianten (Ägypten, Vereinigte Arabische Emirate, Bahrain usw.)
Chinesisch: Vereinfachtes Chinesisch, Traditionelles Chinesisch usw.
Englisch: Amerikanisch, Britisch, Australisch usw. mit verschiedenen Akzenten
Französisch: Frankreich, Kanada usw.
Deutsch: Deutschland, Österreich usw.
Japanisch: Japan
Koreanisch: Korea
Spanisch: Spanien, Mexiko, Argentinien usw.
Andere: Einschließlich Afrikaans, Amharisch und einigen anderen Minderheitensprachen

Python-Programmierschnittstelle

Edge-TTS kann als Python-Modul direkt im Code verwendet werden und eignet sich für die Integration in verschiedene Anwendungen.

Technische Merkmale

1. Ausgabeformat

Audiodateien: Unterstützt MP3-Format
Untertiteldateien: Unterstützt SRT-Format für Untertitel zur einfachen Synchronisation

2. SSML-Unterstützung – Einschränkungen

Aufgrund der Sicherheitsbeschränkungen von Microsoft wurde die benutzerdefinierte SSML-Funktion entfernt. Der Dienst erlaubt nur die Verwendung von SSML-Formaten, die Microsoft Edge selbst generieren kann. Dies bedeutet, dass nur ein einzelnes <voice>-Tag und ein einzelnes <prosody>-Tag darin unterstützt werden.

3. Parametersteuerung

Geschwindigkeitssteuerung: Anpassung über den --rate-Parameter
Lautstärkeregelung: Anpassung über den --volume-Parameter
Tonhöhenregelung: Anpassung über den --pitch-Parameter

Anwendungsbereiche

1. Inhaltserstellung

Podcast-Produktion
Videosynchronisation
Produktion von Hörbüchern

2. Barrierefreie Anwendungen

Vorlesen von Webinhalten
Sprachausgabe von Dokumenten
Hilfsmittel für Sehbehinderte

3. Aus- und Weiterbildung

Sprachlernmaterialien
Synchronisation von Online-Kursen
Generierung von Aussprachebeispielen

4. Automatisierungsanwendungen

Sprachausgabe für intelligente Assistenten
Sprachausgabe für Benachrichtigungssysteme
Stapelverarbeitung von Inhalten

Zusammenfassung der Vorteile

Völlig kostenlos: Keine Gebühren
Hochwertige Sprache: Basierend auf der fortschrittlichen Sprachsynthesetechnologie von Microsoft
Einfache Bedienung: Installation und Nutzung sind sehr einfach
Plattformübergreifend: Unterstützt Linux, macOS, Windows
Mehrsprachig: Unterstützt die wichtigsten Sprachen der Welt
Open Source: Der Code ist Open Source und kann frei geändert und verteilt werden
Aktive Wartung: Das Projekt wird kontinuierlich aktualisiert und gewartet

Hinweise

Netzwerkabhängigkeit: Benötigt eine Internetverbindung, um auf die Online-Dienste von Microsoft zuzugreifen
Wiedergabeabhängigkeit: Der Befehl edge-playback benötigt auf Nicht-Windows-Systemen die Installation des MPV-Players
Dienstbeschränkungen: Unterliegt den Microsoft-Nutzungsbedingungen, es können Nutzungshäufigkeitsbeschränkungen bestehen
SSML-Beschränkungen: Keine Unterstützung für komplexe SSML-Anpassungen, nur grundlegende Anpassungen der Sprachparameter sind möglich

Zusammenfassung

Edge-TTS ist ein sehr nützliches Text-to-Speech-Tool, das auf clevere Weise den Online-TTS-Dienst des Microsoft Edge-Browsers nutzt und Benutzern eine kostenlose, hochwertige Sprachsyntheselösung bietet. Sowohl für den persönlichen Gebrauch als auch für die Projektintegration ist es ein empfehlenswertes Tool. Die einfache Installation und Nutzung in Verbindung mit der umfangreichen Sprachunterstützung machen es zur idealen Wahl für Text-to-Speech-Anforderungen.