Home
Login

Servidor MCP oficial de ElevenLabs, compatible con funciones de procesamiento de audio con IA como texto a voz, clonación de voz y transcripción de audio.

MITPython 0.8kelevenlabselevenlabs-mcp Last Updated: 2025-06-23

Introducción detallada al servidor MCP de ElevenLabs

Resumen del proyecto

El servidor MCP de ElevenLabs es el servidor oficial de Model Context Protocol (MCP) de ElevenLabs, que permite la interacción con potentes API de texto a voz y procesamiento de audio. Este servidor permite a clientes MCP como Claude Desktop, Cursor, Windsurf, OpenAI Agents, etc., generar voz, clonar voces, transcribir audio, entre otras funciones.

Funciones principales

Características principales

  • Texto a voz (TTS): Convierte texto en voz natural.
  • Clonación de voz: Replica y simula características de voz específicas.
  • Transcripción de audio: Convierte archivos de audio en texto.
  • Diseño de voz: Crea y personaliza configuraciones de voz únicas.
  • Aislamiento de audio: Separa sonidos específicos de audio complejo.
  • Generación de efectos de sonido: Crea varios efectos de sonido y paisajes sonoros.

Clientes compatibles

  • Claude Desktop
  • Cursor
  • Windsurf
  • OpenAI Agents
  • Otros clientes compatibles con el protocolo MCP

Instalación y configuración

Requisitos previos

  1. Obtenga una clave API de ElevenLabs (la versión gratuita ofrece 10k créditos mensuales).
  2. Instale uv (administrador de paquetes de Python):
    curl -LsSf https://astral.sh/uv/install.sh | sh
    

Configuración de Claude Desktop

En Claude > Settings > Developer > Edit Config > claude_desktop_config.json, agregue la siguiente configuración:

{
  "mcpServers": {
    "ElevenLabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<insert-your-api-key-here>"
      }
    }
  }
}

Atención usuarios de Windows: Debe habilitar el "Modo desarrollador" en Claude Desktop. Haga clic en "Help" en el menú de hamburguesa en la esquina superior izquierda y seleccione "Enable Developer Mode".

Configuración de otros clientes

Para clientes como Cursor y Windsurf:

pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print

Luego, pegue la configuración de salida en el directorio de configuración del cliente MCP correspondiente.

Ejemplos de uso

Una vez instalado, puede intentar las siguientes operaciones:

  • "Crea un agente de IA que hable como un detective de cine negro, que pueda responder preguntas sobre películas clásicas"
  • "Genera tres variantes de voz para un personaje de dragón anciano sabio, luego elegiré la voz favorita para agregarla a la biblioteca de voces"
  • "Convierte esta grabación mía para que suene como un caballero medieval"
  • "Crea un paisaje sonoro de una tormenta en un bosque denso, que incluya las reacciones de los animales al clima"
  • "Convierte esta voz en texto, identifica a los diferentes hablantes y luego vuelve a convertirla en voz usando una voz única para cada persona"

Desarrollo y contribución

Ejecutar desde el código fuente

  1. Clone el repositorio:

    git clone https://github.com/elevenlabs/elevenlabs-mcp
    cd elevenlabs-mcp
    
  2. Cree un entorno virtual e instale las dependencias:

    uv venv
    source .venv/bin/activate
    uv pip install -e ".[dev]"
    
  3. Configure las variables de entorno:

    cp .env.example .env
    # Edite el archivo .env y agregue su clave API
    
  4. Ejecute las pruebas:

    ./scripts/test.sh
    # O ejecute con opciones
    ./scripts/test.sh --verbose --fail-fast
    

Depuración y pruebas

  • Instale el servidor en Claude Desktop:

    mcp install elevenlabs_mcp/server.py
    
  • Use MCP Inspector para la depuración local:

    mcp dev elevenlabs_mcp/server.py
    

Ubicación de los registros

Ubicación del archivo de registro en tiempo de ejecución de Claude Desktop:

  • Windows: %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
  • macOS: ~/Library/Logs/Claude/mcp-server-elevenlabs.log

Arquitectura técnica

El servidor MCP de ElevenLabs es una capa de abstracción de la API de ElevenLabs, que proporciona a los modelos de lenguaje grandes acceso al contexto de la plataforma de audio AI completa de ElevenLabs. Actúa como una interfaz local amigable para desarrolladores, que reenvía las solicitudes a la API en la nube de ElevenLabs.

Notas

  1. Manejo de tiempo de espera: Algunas operaciones de la API de ElevenLabs (como el diseño de voz y el aislamiento de audio) pueden tardar más en completarse. Pueden aparecer errores de tiempo de espera en el modo de desarrollo del inspector MCP, pero la tarea aún se completará. Este problema no ocurre cuando se usa un cliente como Claude.

  2. Configuración de la ruta: Puede especificar la ruta base donde el servidor MCP busca y genera archivos de ruta relativa agregando la variable de entorno ELEVENLABS_MCP_BASE_PATH.

  3. Solución de problemas: Si encuentra el error "MCP ElevenLabs: spawn uvx ENOENT", use el comando which uvx para confirmar la ruta absoluta y luego use la ruta completa en la configuración (por ejemplo, "command": "/usr/local/bin/uvx").

Valor del proyecto

Este proyecto proporciona a los desarrolladores de aplicaciones de IA:

  • Una interfaz estandarizada de procesamiento de audio
  • Integración perfecta de síntesis de voz
  • Potentes capacidades de análisis de audio
  • Compatibilidad multiplataforma
  • Calidad de audio de nivel empresarial

A través del protocolo MCP, los desarrolladores pueden integrar fácilmente las capacidades de procesamiento de audio de alta calidad de ElevenLabs en varias aplicaciones de IA, simplificando enormemente el flujo de desarrollo de funciones relacionadas con el audio.

Star History Chart