Microsoft Playwright MCP 是一個基於模型上下文協議(Model Context Protocol, MCP)的伺服器,它利用 Playwright 為大語言模型(LLM)提供強大的瀏覽器自動化能力。該項目的核心創新在於通過結構化的可訪問性快照與網頁進行交互,完全繞過了傳統的截圖或視覺調優模型的需求。
這個項目代表了AI代理與Web交互的一種全新範式,讓LLM能夠以更高效、更精確的方式操作瀏覽器,執行複雜的網頁自動化任務。
網頁導航和表單填寫
結構化內容數據提取
LLM驅動的自動化測試
代理的通用瀏覽器交互
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
標準的帶界面瀏覽器模式,適合開發和調試:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
適合後台或批處理操作:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
用於無顯示系統或IDE工作進程:
npx @playwright/mcp@latest --port 8931
配置文件:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
啟用視覺模式:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- 執行點擊操作browser_hover
- 懸停元素browser_drag
- 拖拽操作browser_type
- 文本輸入browser_select_option
- 下拉選擇browser_navigate
- 導航到URLbrowser_navigate_back
- 後退browser_navigate_forward
- 前進browser_tab_list
- 列出所有標籤頁browser_tab_new
- 新建標籤頁browser_tab_select
- 選擇標籤頁browser_tab_close
- 關閉標籤頁browser_snapshot
- 可訪問性快照(推薦)browser_take_screenshot
- 頁面截圖browser_screen_capture
- 屏幕捕獲browser_file_upload
- 文件上傳browser_pdf_save
- 保存為PDFbrowser_press_key
- 按鍵操作browser_handle_dialog
- 處理瀏覽器對話框browser_resize
- 調整窗口大小browser_wait
- 等待指定時間browser_screen_move_mouse
- 鼠標移動browser_screen_click
- 坐標點擊browser_screen_drag
- 屏幕拖拽browser_screen_type
- 屏幕輸入browser_console_messages
- 獲取控制台消息browser_install
- 安裝瀏覽器Playwright MCP 會在以下位置創建瀏覽器配置文件:
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
所有登錄信息都將存儲在該配置文件中,您可以在會話之間刪除它以清除離線狀態。
對於需要編程集成的場景,可以使用以下方式:
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
Microsoft Playwright MCP 項目是AI代理瀏覽器自動化領域的重要創新,它通過以下幾個關鍵優勢重新定義了LLM與Web的交互方式:
結構化交互範式:摒棄傳統的截圖+視覺識別方式,採用可訪問性樹結構,提供更精確、更高效的交互體驗
LLM原生設計:專為大語言模型優化,無需額外的視覺處理能力,降低了系統複雜度和資源消耗
Microsoft官方支持:作為Microsoft官方項目,提供了企業級的可靠性和持續維護保障
該項目代表了AI與Web交互的未來發展方向,隨著MCP生態的不斷完善,預計將在以下領域發揮重要作用:
Microsoft Playwright MCP 不僅是一個技術工具,更是AI代理能力邊界拓展的重要里程碑,為構建更智能、更實用的AI應用提供了堅實的技術基礎。