Offizieller MCP-Server von ElevenLabs, der Funktionen wie Text-to-Speech, Sprachklonierung und Audio-Transkription für die KI-Audioverarbeitung unterstützt.
ElevenLabs MCP Server – Detaillierte Einführung
Projektübersicht
Der ElevenLabs MCP Server ist der offizielle Model Context Protocol (MCP) Server von ElevenLabs, der die Interaktion mit leistungsstarken Text-zu-Sprache- und Audioverarbeitungs-APIs unterstützt. Dieser Server ermöglicht es MCP-Clients wie Claude Desktop, Cursor, Windsurf, OpenAI Agents usw., Sprache zu generieren, Stimmen zu klonen, Audio zu transkribieren und vieles mehr.
Kernfunktionen
Hauptmerkmale
- Text-zu-Sprache (TTS): Wandelt Text in natürliche Sprache um.
- Stimmklonung: Kopiert und simuliert spezifische Stimmmerkmale.
- Audio-Transkription: Wandelt Audiodateien in Text um.
- Sprachdesign: Erstellt und passt einzigartige Sprachkonfigurationen an.
- Audio-Isolation: Trennt bestimmte Geräusche aus komplexem Audio heraus.
- Soundeffekt-Generierung: Erstellt verschiedene Soundeffekte und Klanglandschaften.
Unterstützte Clients
- Claude Desktop
- Cursor
- Windsurf
- OpenAI Agents
- Andere MCP-kompatible Clients
Installation und Konfiguration
Voraussetzungen
- API-Schlüssel von ElevenLabs beziehen (kostenlose Version bietet 10k Credits pro Monat).
uv
installieren (Python-Paketmanager):curl -LsSf https://astral.sh/uv/install.sh | sh
Claude Desktop Konfiguration
In Claude > Settings > Developer > Edit Config > claude_desktop_config.json folgende Konfiguration hinzufügen:
{
"mcpServers": {
"ElevenLabs": {
"command": "uvx",
"args": ["elevenlabs-mcp"],
"env": {
"ELEVENLABS_API_KEY": "<insert-your-api-key-here>"
}
}
}
}
Windows-Benutzer beachten: Der "Entwicklermodus" muss in Claude Desktop aktiviert werden. Klicken Sie im Hamburger-Menü oben links auf "Help" und wählen Sie "Enable Developer Mode".
Andere Client Konfigurationen
Für Clients wie Cursor und Windsurf:
pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print
Die Ausgabe dann in das Konfigurationsverzeichnis des jeweiligen MCP-Clients einfügen.
Anwendungsbeispiele
Nach der Installation können Sie Folgendes ausprobieren:
- "Erstelle einen KI-Agenten, der wie ein Detektiv aus einem Film Noir spricht und Fragen zu klassischen Filmen beantworten kann."
- "Generiere drei Sprachvarianten für einen weisen alten Drachencharakter, und ich wähle dann die Lieblingsstimme aus, um sie der Sprachbibliothek hinzuzufügen."
- "Wandle diese Aufnahme von mir in eine Stimme um, die wie ein mittelalterlicher Ritter klingt."
- "Erstelle eine Klanglandschaft eines Gewitters in einem dichten Wald, einschließlich der Reaktionen von Tieren auf das Wetter."
- "Wandle diese Sprache in Text um, identifiziere verschiedene Sprecher und wandle sie dann für jeden mit einer einzigartigen Stimme wieder in Sprache um."
Entwicklung und Beitrag
Aus dem Quellcode ausführen
Repository klonen:
git clone https://github.com/elevenlabs/elevenlabs-mcp cd elevenlabs-mcp
Virtuelle Umgebung erstellen und Abhängigkeiten installieren:
uv venv source .venv/bin/activate uv pip install -e ".[dev]"
Umgebungsvariablen konfigurieren:
cp .env.example .env # .env-Datei bearbeiten und Ihren API-Schlüssel hinzufügen
Tests ausführen:
./scripts/test.sh # Oder mit Optionen ausführen ./scripts/test.sh --verbose --fail-fast
Debugging und Testen
Server in Claude Desktop installieren:
mcp install elevenlabs_mcp/server.py
MCP Inspector für lokales Debugging verwenden:
mcp dev elevenlabs_mcp/server.py
Speicherort der Protokolle
Speicherort der Protokolldateien während der Ausführung von Claude Desktop:
- Windows:
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS:
~/Library/Logs/Claude/mcp-server-elevenlabs.log
Technische Architektur
Der ElevenLabs MCP Server ist eine Abstraktionsschicht der ElevenLabs API, die großen Sprachmodellen Zugriff auf die vollständige ElevenLabs AI-Audio-Plattform bietet. Er fungiert als entwicklerfreundliche lokale Schnittstelle, die Anfragen an die Cloud-API von ElevenLabs weiterleitet.
Hinweise
Timeout-Behandlung: Einige ElevenLabs API-Operationen (wie Sprachdesign und Audio-Isolation) können länger dauern. Im MCP Inspector-Entwicklungsmodus können Timeout-Fehler auftreten, die Aufgabe wird aber dennoch abgeschlossen. Bei Verwendung von Clients wie Claude tritt dieses Problem nicht auf.
Pfadkonfiguration: Die Basis für die Suche und Ausgabe relativer Pfaddateien durch den MCP-Server kann durch Hinzufügen der Umgebungsvariable
ELEVENLABS_MCP_BASE_PATH
angegeben werden.Fehlerbehebung: Wenn der Fehler "MCP ElevenLabs: spawn uvx ENOENT" auftritt, verwenden Sie den Befehl
which uvx
, um den absoluten Pfad zu bestätigen, und verwenden Sie dann den vollständigen Pfad in der Konfiguration (z. B."command": "/usr/local/bin/uvx"
).
Projektwert
Das Projekt bietet KI-Anwendungsentwicklern:
- Eine standardisierte Audioverarbeitungsschnittstelle
- Nahtlose Sprachsynthese-Integration
- Leistungsstarke Audioanalysefunktionen
- Plattformübergreifende Kompatibilität
- Audioqualität auf Enterprise-Niveau
Durch das MCP-Protokoll können Entwickler die hochwertige Audioverarbeitung von ElevenLabs einfach in verschiedene KI-Anwendungen integrieren, was den Entwicklungsprozess audiobezogener Funktionen erheblich vereinfacht.