O Microsoft Playwright MCP é um servidor baseado no Protocolo de Contexto de Modelo (Model Context Protocol, MCP) que utiliza o Playwright para fornecer poderosas capacidades de automação de navegador para grandes modelos de linguagem (LLMs). A principal inovação deste projeto reside na interação com páginas da web através de snapshots de acessibilidade estruturados, contornando completamente a necessidade de capturas de tela tradicionais ou modelos de ajuste visual.
Este projeto representa um novo paradigma para a interação de agentes de IA com a Web, permitindo que os LLMs operem navegadores de forma mais eficiente e precisa, executando tarefas complexas de automação de páginas da web.
Navegação na Web e Preenchimento de Formulários
Extração de Dados de Conteúdo Estruturado
Testes Automatizados Impulsionados por LLM
Interação Genérica do Navegador para Agentes
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
Modo de navegador padrão com interface, adequado para desenvolvimento e depuração:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
Adequado para operações em segundo plano ou em lote:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
Para sistemas sem tela ou processos de trabalho IDE:
npx @playwright/mcp@latest --port 8931
Arquivo de configuração:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
Ativar o modo visual:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- Executa uma operação de cliquebrowser_hover
- Passa o mouse sobre um elementobrowser_drag
- Operação de arrastarbrowser_type
- Entrada de textobrowser_select_option
- Seleção de menu suspensobrowser_navigate
- Navega para um URLbrowser_navigate_back
- Voltarbrowser_navigate_forward
- Avançarbrowser_tab_list
- Lista todas as abasbrowser_tab_new
- Nova ababrowser_tab_select
- Seleciona uma ababrowser_tab_close
- Fecha uma ababrowser_snapshot
- Snapshot de acessibilidade (recomendado)browser_take_screenshot
- Captura de tela da páginabrowser_screen_capture
- Captura de telabrowser_file_upload
- Envio de arquivobrowser_pdf_save
- Salvar como PDFbrowser_press_key
- Operação de pressionar teclabrowser_handle_dialog
- Lidar com caixas de diálogo do navegadorbrowser_resize
- Redimensionar janelabrowser_wait
- Aguardar um tempo especificadobrowser_screen_move_mouse
- Mover o mouse na telabrowser_screen_click
- Clique de coordenadabrowser_screen_drag
- Arrastar na telabrowser_screen_type
- Entrada na telabrowser_console_messages
- Obter mensagens do consolebrowser_install
- Instalar navegadorO Playwright MCP criará perfis de navegador nos seguintes locais:
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
Todas as informações de login serão armazenadas neste perfil, e você pode excluí-lo entre as sessões para limpar o estado offline.
Para cenários que exigem integração de programação, você pode usar o seguinte:
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
O projeto Microsoft Playwright MCP é uma importante inovação no campo da automação de navegadores para agentes de IA, que redefine a forma como os LLMs interagem com a Web através das seguintes vantagens principais:
Paradigma de Interação Estruturada: Abandona a abordagem tradicional de captura de tela + reconhecimento visual, adotando a estrutura de árvore de acessibilidade, fornecendo uma experiência de interação mais precisa e eficiente.
Design Nativo para LLM: Otimizado especificamente para grandes modelos de linguagem, sem a necessidade de capacidades adicionais de processamento visual, reduzindo a complexidade do sistema e o consumo de recursos.
Suporte Oficial da Microsoft: Como um projeto oficial da Microsoft, fornece confiabilidade de nível empresarial e garantia de manutenção contínua.
Este projeto representa a direção futura do desenvolvimento da interação entre IA e Web. Com o aprimoramento contínuo do ecossistema MCP, espera-se que desempenhe um papel importante nas seguintes áreas:
O Microsoft Playwright MCP não é apenas uma ferramenta técnica, mas também um importante marco na expansão das capacidades dos agentes de IA, fornecendo uma base técnica sólida para a construção de aplicativos de IA mais inteligentes e práticos.