Home
Login

ElevenLabs官方MCP服务器,支持文本转语音、语音克隆、音频转录等AI音频处理功能

MITPython 0.8kelevenlabselevenlabs-mcp Last Updated: 2025-06-23

ElevenLabs MCP服务器详细介绍

项目概述

ElevenLabs MCP服务器是ElevenLabs官方的Model Context Protocol (MCP)服务器,支持与强大的文本转语音和音频处理API进行交互。该服务器允许MCP客户端如Claude Desktop、Cursor、Windsurf、OpenAI Agents等生成语音、克隆声音、转录音频等功能。

核心功能

主要特性

  • 文本转语音(TTS):将文本转换为自然的语音
  • 语音克隆:复制和模拟特定的声音特征
  • 音频转录:将音频文件转换为文本
  • 语音设计:创建和定制独特的语音配置
  • 音频隔离:从复杂音频中分离特定声音
  • 音效生成:创建各种音效和音景

支持的客户端

  • Claude Desktop
  • Cursor
  • Windsurf
  • OpenAI Agents
  • 其他兼容MCP协议的客户端

安装配置

前置要求

  1. ElevenLabs获取API密钥(免费版提供每月10k积分)
  2. 安装uv(Python包管理器):
    curl -LsSf https://astral.sh/uv/install.sh | sh
    

Claude Desktop配置

在Claude > Settings > Developer > Edit Config > claude_desktop_config.json中添加以下配置:

{
  "mcpServers": {
    "ElevenLabs": {
      "command": "uvx",
      "args": ["elevenlabs-mcp"],
      "env": {
        "ELEVENLABS_API_KEY": "<insert-your-api-key-here>"
      }
    }
  }
}

Windows用户注意:需要在Claude Desktop中启用"开发者模式"。点击左上角汉堡菜单中的"Help"并选择"Enable Developer Mode"。

其他客户端配置

对于Cursor和Windsurf等客户端:

pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print

然后将输出的配置粘贴到相应MCP客户端的配置目录中。

使用示例

安装完成后,您可以尝试以下操作:

  • "创建一个说话像黑色电影侦探的AI代理,可以回答关于经典电影的问题"
  • "为一个智慧的古龙角色生成三种语音变体,然后我会选择最喜欢的语音添加到语音库中"
  • "将这段我的录音转换成听起来像中世纪骑士的声音"
  • "创建一个密林中雷暴的音景,包含动物对天气的反应"
  • "将这段语音转为文本,识别不同的说话者,然后为每个人使用独特的声音重新转换回语音"

开发和贡献

从源码运行

  1. 克隆仓库:

    git clone https://github.com/elevenlabs/elevenlabs-mcp
    cd elevenlabs-mcp
    
  2. 创建虚拟环境并安装依赖:

    uv venv
    source .venv/bin/activate
    uv pip install -e ".[dev]"
    
  3. 配置环境变量:

    cp .env.example .env
    # 编辑.env文件并添加您的API密钥
    
  4. 运行测试:

    ./scripts/test.sh
    # 或带选项运行
    ./scripts/test.sh --verbose --fail-fast
    

调试和测试

  • 在Claude Desktop中安装服务器:

    mcp install elevenlabs_mcp/server.py
    
  • 使用MCP Inspector进行本地调试:

    mcp dev elevenlabs_mcp/server.py
    

日志位置

Claude Desktop运行时的日志文件位置:

  • Windows: %APPDATA%\Claude\logs\mcp-server-elevenlabs.log
  • macOS: ~/Library/Logs/Claude/mcp-server-elevenlabs.log

技术架构

ElevenLabs MCP服务器是ElevenLabs API的抽象层,为大型语言模型提供访问完整ElevenLabs AI音频平台的上下文。它作为开发者友好的本地接口,将请求转发到ElevenLabs的云端API。

注意事项

  1. 超时处理:某些ElevenLabs API操作(如语音设计和音频隔离)可能需要较长时间完成。在MCP inspector开发模式下可能会出现超时错误,但任务仍会完成。使用Claude等客户端时不会出现此问题。

  2. 路径配置:可以通过添加ELEVENLABS_MCP_BASE_PATH环境变量来指定MCP服务器查找和输出相对路径文件的基础路径。

  3. 错误排查:如果遇到"MCP ElevenLabs: spawn uvx ENOENT"错误,使用which uvx命令确认绝对路径,然后在配置中使用完整路径(如"command": "/usr/local/bin/uvx")。

项目价值

该项目为AI应用开发者提供了:

  • 标准化的音频处理接口
  • 无缝的语音合成集成
  • 强大的音频分析能力
  • 跨平台的兼容性
  • 企业级的音频质量

通过MCP协议,开发者可以轻松地将ElevenLabs的高质量音频处理能力集成到各种AI应用中,大大简化了音频相关功能的开发流程。

Star History Chart