Apresentação Detalhada do Projeto Chrome MCP Server
Visão Geral do Projeto
O Chrome MCP Server é um servidor de Protocolo de Contexto de Modelo (MCP) baseado em extensão do Chrome que expõe a funcionalidade do seu navegador Chrome para assistentes de IA (como o Claude), permitindo automação complexa do navegador, análise de conteúdo e recursos de pesquisa semântica.
Endereço do Projeto: https://github.com/hangwin/mcp-chrome
Principais Características
🌟 Destaques Principais
- Transforme seu navegador Chrome em um assistente inteligente - Permita que a IA controle seu navegador, transformando-o em uma poderosa ferramenta de automação controlada por IA.
- Use diretamente seu navegador diário - Ao contrário das ferramentas tradicionais de automação de navegador (como o Playwright), o Chrome MCP Server usa diretamente seu navegador Chrome diário.
- Mantenha os hábitos e configurações de usuário existentes - Aproveite as configurações de usuário existentes, status de login, etc., para tornar vários modelos grandes ou chatbots verdadeiramente seus assistentes diários.
🚀 Principais Características Funcionais
- 😁 Independência de Chatbot/Modelo: Permite que qualquer LLM ou cliente ou agente de chatbot de sua preferência automatize seu navegador.
- ⭐️ Use seu navegador original: Integração perfeita com seu ambiente de navegador existente (suas configurações, status de login, etc.).
- 💻 Totalmente Local: Servidor MCP puramente local, garantindo a privacidade do usuário.
- 🚄 HTTP Transmissível: Método de conexão HTTP transmissível.
- 🏎 Entre Abas: Suporte a contexto entre abas.
- 🧠 Pesquisa Semântica: Banco de dados vetorial integrado para descoberta inteligente de conteúdo de abas do navegador.
- 🔍 Análise Inteligente de Conteúdo: Extração de texto e correspondência de similaridade orientadas por IA.
- 🌐 Mais de 20 Ferramentas: Suporta mais de 20 ferramentas, incluindo captura de tela, monitoramento de rede, operações interativas, gerenciamento de favoritos, histórico de navegação, etc.
- 🚀 IA Acelerada por SIMD: Otimização WebAssembly SIMD personalizada, velocidade de operação vetorial aumentada em 4-8 vezes.
Comparação Técnica
Dimensão de Comparação |
Servidor MCP Baseado em Playwright |
Servidor MCP Baseado em Extensão do Chrome |
Uso de Recursos |
❌ Requer iniciar um processo de navegador independente, instalar dependências do Playwright, baixar binários do navegador, etc. |
✅ Não requer iniciar um processo de navegador independente, utiliza diretamente o navegador Chrome já aberto pelo usuário. |
Reutilização da Sessão do Usuário |
❌ Requer novo login |
✅ Usa automaticamente o status de login existente |
Ambiente do Navegador |
❌ Ambiente limpo sem configurações do usuário |
✅ Preserva totalmente o ambiente do usuário |
Acesso à API |
✅ Acesso total à API nativa do Chrome |
✅ Acesso total à API nativa do Chrome |
Velocidade de Inicialização |
❌ Requer iniciar o processo do navegador |
✅ Apenas requer ativar a extensão |
Velocidade de Resposta |
50-200ms comunicação entre processos |
✅ Mais rápido |
Requisitos do Sistema
- Node.js 18+ e pnpm
- Navegador Chrome/Chromium
Instalação e Configuração
1. Baixe a Extensão do Chrome
Baixe a extensão mais recente do Chrome do GitHub:
Link para Download: https://github.com/hangwin/mcp-chrome/releases
2. Instale globalmente o mcp-chrome-bridge
Usando npm:
npm install -g mcp-chrome-bridge
Usando pnpm:
pnpm install -g mcp-chrome-bridge
3. Carregue a Extensão do Chrome
Carregue o arquivo de extensão baixado no navegador Chrome.
4. Configure o Claude Desktop
Adicione a seguinte configuração à configuração MCP do Claude Desktop:
{
"mcpServers": {
"streamable-mcp-server": {
"type": "streamable-http",
"url": "http://127.0.0.1:12306/mcp"
}
}
}
Detalhamento da Classificação das Ferramentas
📊 Gerenciamento do Navegador (4 ferramentas)
- get_windows_and_tabs: Lista todas as janelas e abas do navegador
- chrome_navigate: Navega para URL e controla a viewport
- chrome_close_tabs: Fecha abas ou janelas específicas
- chrome_go_back_or_forward: Controle de navegação do navegador
📸 Captura de Tela e Visual (1 ferramenta)
- chrome_screenshot: Captura de tela avançada, suporta localização de elementos, suporte de página inteira e dimensões personalizadas
🌐 Monitoramento de Rede (4 ferramentas)
- chrome_network_capture_start/stop: Captura de rede da API webRequest
- chrome_network_debugger_start/stop: API de depurador com corpo de resposta
- chrome_network_request: Envia solicitações HTTP personalizadas
🔍 Análise de Conteúdo (3 ferramentas)
- search_tabs_content: Pesquisa semântica orientada por IA entre abas do navegador
- chrome_get_web_content: Extrai conteúdo HTML/texto da página
- chrome_get_interactive_elements: Encontra elementos clicáveis
🎯 Interação (3 ferramentas)
- chrome_click_element: Clica em elementos usando seletores CSS
- chrome_fill_or_select: Preenche formulários e seleciona opções
- chrome_keyboard: Simula entrada de teclado e atalhos
📚 Gerenciamento de Dados (5 ferramentas)
- chrome_history: Pesquisa o histórico do navegador usando filtros de tempo
- chrome_bookmark_search: Encontra favoritos por palavras-chave
- chrome_bookmark_add: Adiciona novos favoritos com suporte a pastas
- chrome_bookmark_delete: Exclui favoritos
Exemplos de Uso
Exemplos de Consulta
A seguir estão algumas demonstrações de cenários de uso reais:
- Consulta de Análise de API: "Eu quero saber qual é a API de pesquisa do Xiaohongshu e como é a estrutura de resposta"
- Análise de Histórico: "Analise meu histórico de navegação do último mês"
- Processamento de Conteúdo: "Traduza e resuma a página da web atual"
- Funcionalidade de Captura de Tela: "Tire uma captura de tela da página inicial do Hugging Face"
- Captura de Elemento: "Capture o ícone da página inicial do Hugging Face"
- Gerenciamento de Favoritos: "Adicione a página atual aos favoritos e coloque-a na pasta apropriada"
- Gerenciamento de Abas: "Feche todas as páginas da web relacionadas ao shadcn"
Documentação Relacionada
- Documento de Design da Arquitetura: Documentação técnica detalhada da arquitetura
- Documentação da API de Ferramentas: Documentação completa da API de ferramentas
- Guia de Solução de Problemas: Soluções para problemas comuns
Resumo
O Chrome MCP Server é um projeto inovador que quebra as limitações das ferramentas tradicionais de automação de navegador, utilizando diretamente o ambiente de navegador diário do usuário, fornecendo aos assistentes de IA poderosos recursos de controle do navegador. Através de seu rico conjunto de ferramentas e design de segurança localizado, os usuários podem permitir que a IA se torne verdadeiramente seu assistente de navegação diário, aumentando muito a eficiência do trabalho e a experiência do usuário.
