Microsoft Playwright MCP は、モデルコンテキストプロトコル(Model Context Protocol, MCP)に基づいたサーバーであり、Playwright を活用して大規模言語モデル(LLM)に強力なブラウザ自動化機能を提供します。このプロジェクトの中核となる革新は、構造化されたアクセシビリティスナップショットを通じてウェブページと対話することで、従来のスクリーンショットや視覚調整モデルの必要性を完全に回避することです。
このプロジェクトは、AIエージェントとウェブのインタラクションにおける全く新しいパラダイムを代表し、LLMがより効率的かつ正確な方法でブラウザを操作し、複雑なウェブ自動化タスクを実行できるようにします。
ウェブナビゲーションとフォーム入力
構造化されたコンテンツデータ抽出
LLM駆動の自動化テスト
エージェントの汎用的なブラウザインタラクション
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
標準的なGUIブラウザモードで、開発とデバッグに適しています。
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
バックグラウンドまたはバッチ処理に適しています。
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
ディスプレイのないシステムまたはIDEのワーキングプロセスで使用します。
npx @playwright/mcp@latest --port 8931
設定ファイル:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
視覚モードの有効化:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- クリック操作を実行browser_hover
- 要素にホバーbrowser_drag
- ドラッグ操作browser_type
- テキスト入力browser_select_option
- ドロップダウン選択browser_navigate
- URLにナビゲートbrowser_navigate_back
- 戻るbrowser_navigate_forward
- 進むbrowser_tab_list
- すべてのタブをリスト表示browser_tab_new
- 新しいタブを作成browser_tab_select
- タブを選択browser_tab_close
- タブを閉じるbrowser_snapshot
- アクセシビリティスナップショット(推奨)browser_take_screenshot
- ページスクリーンショットbrowser_screen_capture
- 画面キャプチャbrowser_file_upload
- ファイルアップロードbrowser_pdf_save
- PDFとして保存browser_press_key
- キー操作browser_handle_dialog
- ブラウザダイアログを処理browser_resize
- ウィンドウサイズを調整browser_wait
- 指定された時間待機browser_screen_move_mouse
- マウス移動browser_screen_click
- 座標クリックbrowser_screen_drag
- 画面ドラッグbrowser_screen_type
- 画面入力browser_console_messages
- コンソールメッセージを取得browser_install
- ブラウザをインストールPlaywright MCP は、以下の場所にブラウザプロファイルを作成します。
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
すべてのログイン情報は、このプロファイルに保存されます。オフライン状態をクリアするには、セッション間で削除できます。
プログラミング統合が必要な場合は、次の方法を使用できます。
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
Microsoft Playwright MCP プロジェクトは、AIエージェントのブラウザ自動化分野における重要なイノベーションであり、以下の主要な利点を通じて、LLMとウェブのインタラクション方法を再定義します。
構造化されたインタラクションパラダイム:従来のスクリーンショット+視覚認識方式を排除し、アクセシビリティツリー構造を採用することで、より正確で効率的なインタラクション体験を提供します。
LLMネイティブ設計:大規模言語モデル向けに最適化されており、追加の視覚処理能力を必要とせず、システムの複雑さとリソース消費を削減します。
Microsoft公式サポート:Microsoft公式プロジェクトとして、エンタープライズレベルの信頼性と継続的なメンテナンス保証を提供します。
このプロジェクトは、AIとウェブのインタラクションの将来の発展方向を代表しており、MCPエコシステムの継続的な改善に伴い、以下の分野で重要な役割を果たすことが期待されます。
Microsoft Playwright MCP は、単なる技術ツールではなく、AIエージェントの能力の境界を拡大する重要なマイルストーンであり、よりインテリジェントで実用的なAIアプリケーションを構築するための強固な技術基盤を提供します。