Home
Login

Servidor MCP oficial da ElevenLabs, suporta funções de processamento de áudio AI como texto para fala, clonagem de voz e transcrição de áudio

MITPython 0.8kelevenlabselevenlabs-mcp Last Updated: 2025-06-23

Apresentação Detalhada do Servidor MCP ElevenLabs

Visão Geral do Projeto

O servidor MCP ElevenLabs é o servidor oficial do Model Context Protocol (MCP) da ElevenLabs, que suporta a interação com APIs poderosas de texto para fala e processamento de áudio. Este servidor permite que clientes MCP, como Claude Desktop, Cursor, Windsurf, OpenAI Agents, gerem voz, clonem vozes, transcrevam áudio, entre outras funções.

Funcionalidades Principais

Principais Características

  • Texto para Fala (TTS): Converte texto em fala natural.
  • Clonagem de Voz: Copia e simula características específicas de uma voz.
  • Transcrição de Áudio: Converte arquivos de áudio em texto.
  • Design de Voz: Cria e personaliza configurações de voz únicas.
  • Isolamento de Áudio: Separa sons específicos de áudios complexos.
  • Geração de Efeitos Sonoros: Cria vários efeitos sonoros e paisagens sonoras.

Clientes Suportados

  • Claude Desktop
  • Cursor
  • Windsurf
  • OpenAI Agents
  • Outros clientes compatíveis com o protocolo MCP

Instalação e Configuração

Pré-requisitos

  1. Obtenha uma chave de API da ElevenLabs (a versão gratuita oferece 10k créditos por mês).
  2. Instale o uv (gerenciador de pacotes Python):
    curl -LsSf https://astral.sh/uv/install.sh | sh
    

Configuração do Claude Desktop

No Claude > Settings > Developer > Edit Config > claude_desktop_config.json, adicione a seguinte configuração:

{
  "mcpServers": {
    "ElevenLabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<insira-sua-chave-de-api-aqui>"
      }
    }
  }
}

Atenção usuários do Windows: É necessário habilitar o "Modo Desenvolvedor" no Claude Desktop. Clique em "Help" no menu hambúrguer no canto superior esquerdo e selecione "Enable Developer Mode".

Configuração de Outros Clientes

Para clientes como Cursor e Windsurf:

pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print

Em seguida, cole a configuração de saída no diretório de configuração do cliente MCP correspondente.

Exemplos de Uso

Após a instalação, você pode tentar as seguintes operações:

  • "Crie um agente de IA que fale como um detetive de filme noir, que possa responder a perguntas sobre filmes clássicos"
  • "Gere três variantes de voz para um personagem sábio de dragão ancião, então eu escolherei a voz favorita para adicionar à biblioteca de vozes"
  • "Converta esta minha gravação para soar como um cavaleiro medieval"
  • "Crie uma paisagem sonora de uma tempestade em uma floresta densa, incluindo as reações dos animais ao clima"
  • "Converta esta fala em texto, identifique os diferentes falantes e, em seguida, use uma voz única para cada pessoa para reconverter em fala"

Desenvolvimento e Contribuição

Executando a partir do código fonte

  1. Clone o repositório:

    git clone https://github.com/elevenlabs/elevenlabs-mcp
    cd elevenlabs-mcp
    
  2. Crie um ambiente virtual e instale as dependências:

    uv venv
    source .venv/bin/activate
    uv pip install -e ".[dev]"
    
  3. Configure as variáveis de ambiente:

    cp .env.example .env
    # Edite o arquivo .env e adicione sua chave de API
    
  4. Execute os testes:

    ./scripts/test.sh
    # Ou execute com opções
    ./scripts/test.sh --verbose --fail-fast
    

Depuração e Teste

  • Instale o servidor no Claude Desktop:

    mcp install elevenlabs_mcp/server.py
    
  • Use o MCP Inspector para depuração local:

    mcp dev elevenlabs_mcp/server.py
    

Localização dos Logs

Localização dos arquivos de log durante a execução do Claude Desktop:

  • Windows: %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
  • macOS: ~/Library/Logs/Claude/mcp-server-elevenlabs.log

Arquitetura Técnica

O servidor MCP ElevenLabs é uma camada de abstração da API ElevenLabs, fornecendo aos grandes modelos de linguagem acesso ao contexto completo da plataforma de áudio AI da ElevenLabs. Ele atua como uma interface local amigável para desenvolvedores, encaminhando solicitações para a API na nuvem da ElevenLabs.

Observações

  1. Tratamento de Timeout: Algumas operações da API ElevenLabs (como design de voz e isolamento de áudio) podem levar mais tempo para serem concluídas. Erros de timeout podem ocorrer no modo de desenvolvimento do MCP inspector, mas a tarefa ainda será concluída. Este problema não ocorre ao usar clientes como o Claude.

  2. Configuração de Caminho: Você pode especificar o caminho base para o servidor MCP procurar e gerar arquivos de caminho relativo adicionando a variável de ambiente ELEVENLABS_MCP_BASE_PATH.

  3. Solução de Problemas: Se você encontrar o erro "MCP ElevenLabs: spawn uvx ENOENT", use o comando which uvx para confirmar o caminho absoluto e, em seguida, use o caminho completo na configuração (por exemplo, "command": "/usr/local/bin/uvx").

Valor do Projeto

Este projeto oferece aos desenvolvedores de aplicativos de IA:

  • Uma interface padronizada de processamento de áudio
  • Integração perfeita de síntese de voz
  • Poderosas capacidades de análise de áudio
  • Compatibilidade entre plataformas
  • Qualidade de áudio de nível empresarial

Através do protocolo MCP, os desenvolvedores podem facilmente integrar as capacidades de processamento de áudio de alta qualidade da ElevenLabs em várias aplicações de IA, simplificando grandemente o processo de desenvolvimento de funcionalidades relacionadas ao áudio.

Star History Chart