Microsoft Playwright MCP est un serveur basé sur le protocole de contexte de modèle (Model Context Protocol, MCP) qui exploite Playwright pour fournir de puissantes capacités d'automatisation de navigateur aux grands modèles de langage (LLM). L'innovation centrale de ce projet réside dans l'interaction avec les pages web via des instantanés d'accessibilité structurés, contournant complètement le besoin de captures d'écran traditionnelles ou de modèles d'ajustement visuel.
Ce projet représente un nouveau paradigme pour l'interaction des agents IA avec le web, permettant aux LLM d'opérer les navigateurs de manière plus efficace et précise, et d'exécuter des tâches d'automatisation web complexes.
Navigation web et remplissage de formulaires
Extraction de données de contenu structuré
Tests automatisés pilotés par LLM
Interaction de navigateur universelle pour les agents
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
Mode navigateur standard avec interface, adapté au développement et au débogage :
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
Adapté aux opérations en arrière-plan ou au traitement par lots :
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
Pour les systèmes sans affichage ou les processus de travail IDE :
npx @playwright/mcp@latest --port 8931
Fichier de configuration :
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
Activer le mode visuel :
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- Exécute une opération de clicbrowser_hover
- Survole un élémentbrowser_drag
- Opération de glisser-déposerbrowser_type
- Saisie de textebrowser_select_option
- Sélection dans une liste déroulantebrowser_navigate
- Navigue vers une URLbrowser_navigate_back
- Retour en arrièrebrowser_navigate_forward
- Avancerbrowser_tab_list
- Liste tous les ongletsbrowser_tab_new
- Ouvre un nouvel ongletbrowser_tab_select
- Sélectionne un ongletbrowser_tab_close
- Ferme un ongletbrowser_snapshot
- Instantané d'accessibilité (recommandé)browser_take_screenshot
- Capture d'écran de la pagebrowser_screen_capture
- Capture d'écranbrowser_file_upload
- Téléchargement de fichierbrowser_pdf_save
- Enregistrement au format PDFbrowser_press_key
- Opération de touchebrowser_handle_dialog
- Gère les boîtes de dialogue du navigateurbrowser_resize
- Redimensionne la fenêtrebrowser_wait
- Attend une durée spécifiéebrowser_screen_move_mouse
- Déplacement de la sourisbrowser_screen_click
- Clic de coordonnéesbrowser_screen_drag
- Glisser-déposer d'écranbrowser_screen_type
- Saisie d'écranbrowser_console_messages
- Obtient les messages de la consolebrowser_install
- Installe le navigateurPlaywright MCP crée des profils de navigateur aux emplacements suivants :
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
Toutes les informations de connexion seront stockées dans ce profil. Vous pouvez le supprimer entre les sessions pour effacer l'état hors ligne.
Pour les scénarios nécessitant une intégration de programmation, vous pouvez utiliser les méthodes suivantes :
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
Le projet Microsoft Playwright MCP est une innovation importante dans le domaine de l'automatisation de navigateur pour les agents IA. Il redéfinit la façon dont les LLM interagissent avec le web grâce aux avantages clés suivants :
Paradigme d'interaction structurée : Abandonne l'approche traditionnelle de capture d'écran + reconnaissance visuelle, adopte une structure d'arbre d'accessibilité, offrant une expérience d'interaction plus précise et plus efficace.
Conception native LLM : Optimisé spécifiquement pour les grands modèles de langage, sans nécessiter de capacités de traitement visuel supplémentaires, réduisant la complexité du système et la consommation de ressources.
Support officiel de Microsoft : En tant que projet officiel de Microsoft, il offre une fiabilité de niveau entreprise et une garantie de maintenance continue.
Ce projet représente l'orientation future du développement de l'interaction entre l'IA et le web. Avec l'amélioration continue de l'écosystème MCP, il devrait jouer un rôle important dans les domaines suivants :
Microsoft Playwright MCP n'est pas seulement un outil technique, mais aussi une étape importante dans l'expansion des limites des capacités des agents IA, fournissant une base technique solide pour la construction d'applications IA plus intelligentes et plus pratiques.