Home
Login

Offizieller MCP-Server von ElevenLabs, der Funktionen wie Text-to-Speech, Sprachklonierung und Audio-Transkription für die KI-Audioverarbeitung unterstützt.

MITPython 0.8kelevenlabselevenlabs-mcp Last Updated: 2025-06-23

ElevenLabs MCP Server – Detaillierte Einführung

Projektübersicht

Der ElevenLabs MCP Server ist der offizielle Model Context Protocol (MCP) Server von ElevenLabs, der die Interaktion mit leistungsstarken Text-zu-Sprache- und Audioverarbeitungs-APIs unterstützt. Dieser Server ermöglicht es MCP-Clients wie Claude Desktop, Cursor, Windsurf, OpenAI Agents usw., Sprache zu generieren, Stimmen zu klonen, Audio zu transkribieren und vieles mehr.

Kernfunktionen

Hauptmerkmale

  • Text-zu-Sprache (TTS): Wandelt Text in natürliche Sprache um.
  • Stimmklonung: Kopiert und simuliert spezifische Stimmmerkmale.
  • Audio-Transkription: Wandelt Audiodateien in Text um.
  • Sprachdesign: Erstellt und passt einzigartige Sprachkonfigurationen an.
  • Audio-Isolation: Trennt bestimmte Geräusche aus komplexem Audio heraus.
  • Soundeffekt-Generierung: Erstellt verschiedene Soundeffekte und Klanglandschaften.

Unterstützte Clients

  • Claude Desktop
  • Cursor
  • Windsurf
  • OpenAI Agents
  • Andere MCP-kompatible Clients

Installation und Konfiguration

Voraussetzungen

  1. API-Schlüssel von ElevenLabs beziehen (kostenlose Version bietet 10k Credits pro Monat).
  2. uv installieren (Python-Paketmanager):
    curl -LsSf https://astral.sh/uv/install.sh | sh
    

Claude Desktop Konfiguration

In Claude > Settings > Developer > Edit Config > claude_desktop_config.json folgende Konfiguration hinzufügen:

{
  "mcpServers": {
    "ElevenLabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<insert-your-api-key-here>"
      }
    }
  }
}

Windows-Benutzer beachten: Der "Entwicklermodus" muss in Claude Desktop aktiviert werden. Klicken Sie im Hamburger-Menü oben links auf "Help" und wählen Sie "Enable Developer Mode".

Andere Client Konfigurationen

Für Clients wie Cursor und Windsurf:

pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print

Die Ausgabe dann in das Konfigurationsverzeichnis des jeweiligen MCP-Clients einfügen.

Anwendungsbeispiele

Nach der Installation können Sie Folgendes ausprobieren:

  • "Erstelle einen KI-Agenten, der wie ein Detektiv aus einem Film Noir spricht und Fragen zu klassischen Filmen beantworten kann."
  • "Generiere drei Sprachvarianten für einen weisen alten Drachencharakter, und ich wähle dann die Lieblingsstimme aus, um sie der Sprachbibliothek hinzuzufügen."
  • "Wandle diese Aufnahme von mir in eine Stimme um, die wie ein mittelalterlicher Ritter klingt."
  • "Erstelle eine Klanglandschaft eines Gewitters in einem dichten Wald, einschließlich der Reaktionen von Tieren auf das Wetter."
  • "Wandle diese Sprache in Text um, identifiziere verschiedene Sprecher und wandle sie dann für jeden mit einer einzigartigen Stimme wieder in Sprache um."

Entwicklung und Beitrag

Aus dem Quellcode ausführen

  1. Repository klonen:

    git clone https://github.com/elevenlabs/elevenlabs-mcp
    cd elevenlabs-mcp
    
  2. Virtuelle Umgebung erstellen und Abhängigkeiten installieren:

    uv venv
    source .venv/bin/activate
    uv pip install -e ".[dev]"
    
  3. Umgebungsvariablen konfigurieren:

    cp .env.example .env
    # .env-Datei bearbeiten und Ihren API-Schlüssel hinzufügen
    
  4. Tests ausführen:

    ./scripts/test.sh
    # Oder mit Optionen ausführen
    ./scripts/test.sh --verbose --fail-fast
    

Debugging und Testen

  • Server in Claude Desktop installieren:

    mcp install elevenlabs_mcp/server.py
    
  • MCP Inspector für lokales Debugging verwenden:

    mcp dev elevenlabs_mcp/server.py
    

Speicherort der Protokolle

Speicherort der Protokolldateien während der Ausführung von Claude Desktop:

  • Windows: %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
  • macOS: ~/Library/Logs/Claude/mcp-server-elevenlabs.log

Technische Architektur

Der ElevenLabs MCP Server ist eine Abstraktionsschicht der ElevenLabs API, die großen Sprachmodellen Zugriff auf die vollständige ElevenLabs AI-Audio-Plattform bietet. Er fungiert als entwicklerfreundliche lokale Schnittstelle, die Anfragen an die Cloud-API von ElevenLabs weiterleitet.

Hinweise

  1. Timeout-Behandlung: Einige ElevenLabs API-Operationen (wie Sprachdesign und Audio-Isolation) können länger dauern. Im MCP Inspector-Entwicklungsmodus können Timeout-Fehler auftreten, die Aufgabe wird aber dennoch abgeschlossen. Bei Verwendung von Clients wie Claude tritt dieses Problem nicht auf.

  2. Pfadkonfiguration: Die Basis für die Suche und Ausgabe relativer Pfaddateien durch den MCP-Server kann durch Hinzufügen der Umgebungsvariable ELEVENLABS_MCP_BASE_PATH angegeben werden.

  3. Fehlerbehebung: Wenn der Fehler "MCP ElevenLabs: spawn uvx ENOENT" auftritt, verwenden Sie den Befehl which uvx, um den absoluten Pfad zu bestätigen, und verwenden Sie dann den vollständigen Pfad in der Konfiguration (z. B. "command": "/usr/local/bin/uvx").

Projektwert

Das Projekt bietet KI-Anwendungsentwicklern:

  • Eine standardisierte Audioverarbeitungsschnittstelle
  • Nahtlose Sprachsynthese-Integration
  • Leistungsstarke Audioanalysefunktionen
  • Plattformübergreifende Kompatibilität
  • Audioqualität auf Enterprise-Niveau

Durch das MCP-Protokoll können Entwickler die hochwertige Audioverarbeitung von ElevenLabs einfach in verschiedene KI-Anwendungen integrieren, was den Entwicklungsprozess audiobezogener Funktionen erheblich vereinfacht.

Star History Chart