Serveur MCP officiel d'ElevenLabs, prenant en charge les fonctions de traitement audio IA telles que la synthèse vocale, le clonage vocal et la transcription audio.
Présentation détaillée du serveur MCP ElevenLabs
Aperçu du projet
Le serveur MCP ElevenLabs est le serveur Model Context Protocol (MCP) officiel d'ElevenLabs, prenant en charge l'interaction avec de puissantes API de synthèse vocale et de traitement audio. Ce serveur permet aux clients MCP tels que Claude Desktop, Cursor, Windsurf, OpenAI Agents, etc., de générer de la voix, de cloner des voix, de transcrire de l'audio, etc.
Fonctionnalités principales
Caractéristiques principales
- Synthèse vocale (TTS) : Conversion de texte en parole naturelle
- Clonage de voix : Reproduction et simulation de caractéristiques vocales spécifiques
- Transcription audio : Conversion de fichiers audio en texte
- Conception vocale : Création et personnalisation de configurations vocales uniques
- Isolation audio : Séparation de sons spécifiques à partir d'audio complexe
- Génération d'effets sonores : Création de divers effets sonores et paysages sonores
Clients pris en charge
- Claude Desktop
- Cursor
- Windsurf
- OpenAI Agents
- Autres clients compatibles avec le protocole MCP
Installation et configuration
Prérequis
- Obtenir une clé API depuis ElevenLabs (la version gratuite offre 10k crédits par mois)
- Installer
uv
(gestionnaire de paquets Python) :curl -LsSf https://astral.sh/uv/install.sh | sh
Configuration de Claude Desktop
Dans Claude > Settings > Developer > Edit Config > claude_desktop_config.json, ajouter la configuration suivante :
{
"mcpServers": {
"ElevenLabs": {
"command": "uvx",
"args": ["elevenlabs-mcp"],
"env": {
"ELEVENLABS_API_KEY": "<insérer-votre-clé-api-ici>"
}
}
}
}
Attention aux utilisateurs Windows : Il est nécessaire d'activer le "Mode Développeur" dans Claude Desktop. Cliquer sur "Help" dans le menu hamburger en haut à gauche et sélectionner "Enable Developer Mode".
Configuration des autres clients
Pour les clients tels que Cursor et Windsurf :
pip install elevenlabs-mcp
python -m elevenlabs_mcp --api-key={{PUT_YOUR_API_KEY_HERE}} --print
Ensuite, coller la configuration affichée dans le répertoire de configuration du client MCP correspondant.
Exemples d'utilisation
Une fois l'installation terminée, vous pouvez essayer les opérations suivantes :
- "Créer un agent IA qui parle comme un détective de film noir, capable de répondre à des questions sur les films classiques"
- "Générer trois variantes vocales pour un personnage de dragon ancien et sage, puis je choisirai la voix préférée à ajouter à la bibliothèque vocale"
- "Transformer cet enregistrement de ma voix pour qu'il ressemble à la voix d'un chevalier médiéval"
- "Créer un paysage sonore d'un orage dans une forêt dense, incluant les réactions des animaux à la météo"
- "Convertir cet audio en texte, identifier les différents locuteurs, puis reconvertir en audio en utilisant une voix unique pour chaque personne"
Développement et contribution
Exécution à partir du code source
Cloner le dépôt :
git clone https://github.com/elevenlabs/elevenlabs-mcp cd elevenlabs-mcp
Créer un environnement virtuel et installer les dépendances :
uv venv source .venv/bin/activate uv pip install -e ".[dev]"
Configurer les variables d'environnement :
cp .env.example .env # Modifier le fichier .env et ajouter votre clé API
Exécuter les tests :
./scripts/test.sh # Ou exécuter avec des options ./scripts/test.sh --verbose --fail-fast
Débogage et tests
Installer le serveur dans Claude Desktop :
mcp install elevenlabs_mcp/server.py
Utiliser MCP Inspector pour le débogage local :
mcp dev elevenlabs_mcp/server.py
Emplacement des journaux
Emplacement des fichiers journaux lors de l'exécution de Claude Desktop :
- Windows:
%APPDATA%\Claude\logs\mcp-server-elevenlabs.log
- macOS:
~/Library/Logs/Claude/mcp-server-elevenlabs.log
Architecture technique
Le serveur MCP ElevenLabs est une couche d'abstraction de l'API ElevenLabs, fournissant aux grands modèles de langage un accès au contexte complet de la plateforme audio AI ElevenLabs. Il sert d'interface locale conviviale pour les développeurs, transmettant les requêtes à l'API cloud d'ElevenLabs.
Remarques
Gestion des délais d'attente : Certaines opérations de l'API ElevenLabs (telles que la conception vocale et l'isolation audio) peuvent prendre plus de temps. Des erreurs de délai d'attente peuvent se produire en mode de développement MCP inspector, mais la tâche sera toujours terminée. Ce problème ne se produit pas lors de l'utilisation de clients tels que Claude.
Configuration du chemin : Vous pouvez spécifier le chemin de base où le serveur MCP recherche et génère les fichiers de chemin relatif en ajoutant la variable d'environnement
ELEVENLABS_MCP_BASE_PATH
.Dépannage : Si vous rencontrez l'erreur "MCP ElevenLabs: spawn uvx ENOENT", utilisez la commande
which uvx
pour confirmer le chemin absolu, puis utilisez le chemin complet dans la configuration (par exemple,"command": "/usr/local/bin/uvx"
).
Valeur du projet
Ce projet offre aux développeurs d'applications IA :
- Une interface standardisée de traitement audio
- Une intégration transparente de la synthèse vocale
- De puissantes capacités d'analyse audio
- Une compatibilité multiplateforme
- Une qualité audio de niveau entreprise
Grâce au protocole MCP, les développeurs peuvent facilement intégrer les capacités de traitement audio de haute qualité d'ElevenLabs dans diverses applications d'IA, simplifiant considérablement le processus de développement des fonctionnalités liées à l'audio.