Microsoft Playwright MCP ist ein Server, der auf dem Model Context Protocol (MCP) basiert und Playwright nutzt, um Large Language Models (LLM) leistungsstarke Browserautomatisierungsfunktionen bereitzustellen. Die Kerninnovation dieses Projekts liegt in der Interaktion mit Webseiten über strukturierte Accessibility-Snapshots, wodurch die Notwendigkeit herkömmlicher Screenshots oder visuell abgestimmter Modelle vollständig umgangen wird.
Dieses Projekt stellt ein neues Paradigma für die Interaktion von KI-Agenten mit dem Web dar und ermöglicht es LLMs, Browser effizienter und präziser zu bedienen und komplexe Webautomatisierungsaufgaben auszuführen.
Webseitennavigation und Formularausfüllen
Extraktion strukturierter Inhaltsdaten
LLM-gesteuerte automatisierte Tests
Allgemeine Browserinteraktion für Agenten
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
Standardmäßiger Browser-Modus mit Benutzeroberfläche, geeignet für Entwicklung und Debugging:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
Geeignet für Hintergrund- oder Batch-Operationen:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
Für Systeme ohne Anzeige oder IDE-Arbeitsprozesse:
npx @playwright/mcp@latest --port 8931
Konfigurationsdatei:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
Aktivieren des visuellen Modus:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- Klick ausführenbrowser_hover
- Element überfahrenbrowser_drag
- Drag-and-Drop-Operationbrowser_type
- Texteingabebrowser_select_option
- Dropdown-Auswahlbrowser_navigate
- Zu URL navigierenbrowser_navigate_back
- Zurückbrowser_navigate_forward
- Vorwärtsbrowser_tab_list
- Alle Tabs auflistenbrowser_tab_new
- Neuen Tab erstellenbrowser_tab_select
- Tab auswählenbrowser_tab_close
- Tab schließenbrowser_snapshot
- Accessibility-Snapshot (empfohlen)browser_take_screenshot
- Seiten-Screenshotbrowser_screen_capture
- Bildschirmaufnahmebrowser_file_upload
- Datei hochladenbrowser_pdf_save
- Als PDF speichernbrowser_press_key
- Tastendruckbrowser_handle_dialog
- Browser-Dialog behandelnbrowser_resize
- Fenstergröße ändernbrowser_wait
- Angegebene Zeit wartenbrowser_screen_move_mouse
- Maus bewegenbrowser_screen_click
- Koordinatenklickbrowser_screen_drag
- Bildschirm-Drag-and-Dropbrowser_screen_type
- Bildschirmeingabebrowser_console_messages
- Konsolenmeldungen abrufenbrowser_install
- Browser installierenPlaywright MCP erstellt Browserprofile an folgenden Speicherorten:
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
Alle Anmeldeinformationen werden in diesem Profil gespeichert. Sie können es zwischen Sitzungen löschen, um den Offline-Status zu löschen.
Für Szenarien, die eine programmatische Integration erfordern, können Sie Folgendes verwenden:
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
Das Microsoft Playwright MCP-Projekt ist eine wichtige Innovation im Bereich der Browserautomatisierung für KI-Agenten. Es definiert die Interaktion von LLMs mit dem Web durch die folgenden wichtigen Vorteile neu:
Strukturiertes Interaktionsparadigma: Verwirft den traditionellen Screenshot- + visuelle Erkennungsansatz und verwendet eine Accessibility-Baumstruktur, um eine präzisere und effizientere Interaktion zu ermöglichen.
LLM-natives Design: Speziell für Large Language Models optimiert, ohne zusätzliche visuelle Verarbeitungsfunktionen, wodurch die Systemkomplexität und der Ressourcenverbrauch reduziert werden.
Offizielle Microsoft-Unterstützung: Als offizielles Microsoft-Projekt bietet es Zuverlässigkeit auf Unternehmensebene und kontinuierliche Wartung.
Dieses Projekt repräsentiert die zukünftige Entwicklung der Interaktion zwischen KI und Web. Mit der kontinuierlichen Weiterentwicklung des MCP-Ökosystems wird erwartet, dass es in den folgenden Bereichen eine wichtige Rolle spielen wird:
Microsoft Playwright MCP ist nicht nur ein technisches Werkzeug, sondern auch ein wichtiger Meilenstein bei der Erweiterung der Fähigkeiten von KI-Agenten und bietet eine solide technische Grundlage für den Aufbau intelligenterer und praktischerer KI-Anwendungen.