hangwin/mcp-chromeView GitHub Homepage for Latest Official Releases
基于 Chrome 扩展的 MCP 服务器,让 AI 助手能够控制您的浏览器进行自动化操作、内容分析和语义搜索
MITTypeScriptmcp-chromehangwin 5.3k Last Updated: August 09, 2025
Chrome MCP Server 项目详细介绍
项目概述
Chrome MCP Server 是一个基于 Chrome 扩展的模型上下文协议(MCP)服务器,它将您的 Chrome 浏览器功能暴露给 AI 助手(如 Claude),实现复杂的浏览器自动化、内容分析和语义搜索功能。
项目地址: https://github.com/hangwin/mcp-chrome
核心特性
🌟 主要亮点
- 将您的 Chrome 浏览器转变为智能助手 - 让 AI 控制您的浏览器,将其转变为强大的 AI 控制自动化工具
- 直接使用您的日常浏览器 - 与传统浏览器自动化工具(如 Playwright)不同,Chrome MCP Server 直接使用您的日常 Chrome 浏览器
- 保持现有用户习惯和配置 - 利用现有的用户配置、登录状态等,让各种大型模型或聊天机器人真正成为您的日常助手
🚀 核心功能特点
- 😁 聊天机器人/模型无关性: 让您偏好的任何 LLM 或聊天机器人客户端或代理自动化您的浏览器
- ⭐️ 使用您的原始浏览器: 与您现有的浏览器环境无缝集成(您的配置、登录状态等)
- 💻 完全本地化: 纯本地 MCP 服务器,确保用户隐私
- 🚄 可流式传输的 HTTP: 可流式传输的 HTTP 连接方法
- 🏎 跨标签页: 跨标签页上下文支持
- 🧠 语义搜索: 内置向量数据库,用于智能浏览器标签页内容发现
- 🔍 智能内容分析: AI 驱动的文本提取和相似性匹配
- 🌐 20+ 工具: 支持截图、网络监控、交互操作、书签管理、浏览历史等 20 多种工具
- 🚀 SIMD 加速 AI: 自定义 WebAssembly SIMD 优化,向量操作速度提升 4-8 倍
技术对比
对比维度 | 基于 Playwright 的 MCP 服务器 | 基于 Chrome 扩展的 MCP 服务器 |
---|---|---|
资源使用 | ❌ 需要启动独立浏览器进程,安装 Playwright 依赖,下载浏览器二进制文件等 | ✅ 无需启动独立浏览器进程,直接利用用户已打开的 Chrome 浏览器 |
用户会话重用 | ❌ 需要重新登录 | ✅ 自动使用现有登录状态 |
浏览器环境 | ❌ 清洁环境缺乏用户设置 | ✅ 完全保留用户环境 |
API 访问 | ✅ 完全访问 Chrome 原生 API | ✅ 完全访问 Chrome 原生 API |
启动速度 | ❌ 需要启动浏览器进程 | ✅ 只需激活扩展 |
响应速度 | 50-200ms 进程间通信 | ✅ 更快 |
系统要求
- Node.js 18+ 和 pnpm
- Chrome/Chromium 浏览器
安装和配置
1. 下载 Chrome 扩展
从 GitHub 下载最新的 Chrome 扩展:
下载链接: https://github.com/hangwin/mcp-chrome/releases
2. 全局安装 mcp-chrome-bridge
使用 npm:
npm install -g mcp-chrome-bridge
使用 pnpm:
pnpm install -g mcp-chrome-bridge
3. 加载 Chrome 扩展
将下载的扩展文件加载到 Chrome 浏览器中。
4. 配置 Claude Desktop
将以下配置添加到 Claude Desktop 的 MCP 配置中:
{
"mcpServers": {
"streamable-mcp-server": {
"type": "streamable-http",
"url": "http://127.0.0.1:12306/mcp"
}
}
}
工具分类详解
📊 浏览器管理(4个工具)
- get_windows_and_tabs: 列出所有浏览器窗口和标签页
- chrome_navigate: 导航到 URL 和控制视口
- chrome_close_tabs: 关闭特定标签页或窗口
- chrome_go_back_or_forward: 浏览器导航控制
📸 截图和视觉(1个工具)
- chrome_screenshot: 高级截图捕获,支持元素定位、全页支持和自定义尺寸
🌐 网络监控(4个工具)
- chrome_network_capture_start/stop: webRequest API 网络捕获
- chrome_network_debugger_start/stop: 带响应体的调试器 API
- chrome_network_request: 发送自定义 HTTP 请求
🔍 内容分析(3个工具)
- search_tabs_content: AI 驱动的跨浏览器标签页语义搜索
- chrome_get_web_content: 从页面提取 HTML/文本内容
- chrome_get_interactive_elements: 查找可点击元素
🎯 交互(3个工具)
- chrome_click_element: 使用 CSS 选择器点击元素
- chrome_fill_or_select: 填写表单和选择选项
- chrome_keyboard: 模拟键盘输入和快捷键
📚 数据管理(5个工具)
- chrome_history: 使用时间过滤器搜索浏览器历史
- chrome_bookmark_search: 按关键词查找书签
- chrome_bookmark_add: 添加带文件夹支持的新书签
- chrome_bookmark_delete: 删除书签
使用示例
查询示例
以下是一些实际使用场景的演示:
- API 分析查询: "我想知道小红书的搜索 API 是什么,响应结构是什么样的"
- 历史分析: "分析我过去一个月的浏览历史"
- 内容处理: "翻译并总结当前网页"
- 截图功能: "截取 Hugging Face 主页的截图"
- 元素捕获: "从 Hugging Face 主页捕获图标"
- 书签管理: "将当前页面添加到书签并放入适当的文件夹中"
- 标签页管理: "关闭所有与 shadcn 相关的网页"
相关文档
- 架构设计文档: 详细的技术架构文档
- 工具 API 文档: 完整的工具 API 文档
- 故障排除指南: 常见问题解决方案
总结
Chrome MCP Server 是一个创新的项目,它打破了传统浏览器自动化工具的限制,直接利用用户的日常浏览器环境,为 AI 助手提供了强大的浏览器控制能力。通过其丰富的工具集和本地化的安全设计,用户可以让 AI 真正成为他们的日常浏览助手,大大提升工作效率和用户体验。