Microsoft Playwright MCP는 모델 컨텍스트 프로토콜(Model Context Protocol, MCP) 기반 서버로, Playwright를 활용하여 대규모 언어 모델(LLM)에 강력한 브라우저 자동화 기능을 제공합니다. 이 프로젝트의 핵심 혁신은 구조화된 접근성 스냅샷을 통해 웹 페이지와 상호 작용하며, 기존의 스크린샷 또는 시각적 튜닝 모델의 필요성을 완전히 우회한다는 점입니다.
이 프로젝트는 AI 에이전트와 웹 상호 작용의 새로운 패러다임을 제시하며, LLM이 더욱 효율적이고 정확한 방식으로 브라우저를 조작하고 복잡한 웹 자동화 작업을 수행할 수 있도록 합니다.
웹 페이지 탐색 및 양식 작성
구조화된 콘텐츠 데이터 추출
LLM 기반 자동화 테스트
에이전트의 범용 브라우저 상호 작용
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest"
]
}
}
}
# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'
표준적인 GUI 브라우저 모드로, 개발 및 디버깅에 적합합니다.
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": ["@playwright/mcp@latest"]
}
}
}
백그라운드 또는 배치 작업에 적합합니다.
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--headless"
]
}
}
}
디스플레이 시스템 또는 IDE 작업 프로세스가 없는 경우에 사용됩니다.
npx @playwright/mcp@latest --port 8931
구성 파일:
{
"mcpServers": {
"playwright": {
"url": "http://localhost:8931/sse"
}
}
}
시각 모드 활성화:
{
"mcpServers": {
"playwright": {
"command": "npx",
"args": [
"@playwright/mcp@latest",
"--vision"
]
}
}
}
browser_click
- 클릭 작업 실행browser_hover
- 요소에 마우스 오버browser_drag
- 드래그 작업browser_type
- 텍스트 입력browser_select_option
- 드롭다운 선택browser_navigate
- URL로 이동browser_navigate_back
- 뒤로 가기browser_navigate_forward
- 앞으로 가기browser_tab_list
- 모든 탭 나열browser_tab_new
- 새 탭 생성browser_tab_select
- 탭 선택browser_tab_close
- 탭 닫기browser_snapshot
- 접근성 스냅샷 (권장)browser_take_screenshot
- 페이지 스크린샷browser_screen_capture
- 화면 캡처browser_file_upload
- 파일 업로드browser_pdf_save
- PDF로 저장browser_press_key
- 키 누름 작업browser_handle_dialog
- 브라우저 대화 상자 처리browser_resize
- 창 크기 조정browser_wait
- 지정된 시간 동안 대기browser_screen_move_mouse
- 마우스 이동browser_screen_click
- 좌표 클릭browser_screen_drag
- 화면 드래그browser_screen_type
- 화면 입력browser_console_messages
- 콘솔 메시지 가져오기browser_install
- 브라우저 설치Playwright MCP는 다음 위치에 브라우저 프로필을 생성합니다.
%USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
~/Library/Caches/ms-playwright/mcp-chrome-profile
~/.cache/ms-playwright/mcp-chrome-profile
모든 로그인 정보는 해당 프로필에 저장되며, 세션 간에 삭제하여 오프라인 상태를 지울 수 있습니다.
프로그래밍 통합이 필요한 경우 다음 방법을 사용할 수 있습니다.
import { createServer } from '@playwright/mcp';
const server = createServer({
launchOptions: { headless: true }
});
transport = new SSEServerTransport("/messages", res);
server.connect(transport);
Microsoft Playwright MCP 프로젝트는 AI 에이전트 브라우저 자동화 분야의 중요한 혁신이며, 다음과 같은 주요 장점을 통해 LLM과 웹의 상호 작용 방식을 재정의합니다.
구조화된 상호 작용 패러다임: 기존의 스크린샷 + 시각 인식 방식을 버리고 접근성 트리 구조를 채택하여 더욱 정확하고 효율적인 상호 작용 경험 제공
LLM 네이티브 디자인: 대규모 언어 모델에 최적화되어 추가적인 시각 처리 능력 없이 시스템 복잡성과 리소스 소비 감소
Microsoft 공식 지원: Microsoft 공식 프로젝트로서 엔터프라이즈급 신뢰성과 지속적인 유지 보수 보장
이 프로젝트는 AI와 웹 상호 작용의 미래 발전 방향을 제시하며, MCP 생태계가 지속적으로 발전함에 따라 다음 분야에서 중요한 역할을 할 것으로 예상됩니다.
Microsoft Playwright MCP는 단순한 기술 도구가 아니라 AI 에이전트 능력의 경계를 확장하는 중요한 이정표이며, 더욱 지능적이고 실용적인 AI 애플리케이션을 구축하기 위한 견고한 기술 기반을 제공합니다.