Home
Login

خادم بروتوكول سياق النموذج (MCP) المستند إلى Playwright، يوفر أتمتة المتصفح لنماذج اللغة الكبيرة (LLM).

Apache-2.0TypeScript 12.6kmicrosoftplaywright-mcp Last Updated: 2025-06-20

مشروع Microsoft Playwright MCP: نظرة تفصيلية

نظرة عامة

Microsoft Playwright MCP هو خادم يعتمد على بروتوكول سياق النموذج (Model Context Protocol, MCP)، ويستخدم Playwright لتوفير قدرات أتمتة متصفح قوية للنماذج اللغوية الكبيرة (LLM). يكمن الابتكار الأساسي لهذا المشروع في التفاعل مع صفحات الويب من خلال لقطات إمكانية الوصول المنظمة، متجاوزًا تمامًا الحاجة إلى لقطات الشاشة التقليدية أو نماذج الضبط الدقيق البصري.

يمثل هذا المشروع نموذجًا جديدًا تمامًا لتفاعل وكلاء الذكاء الاصطناعي مع الويب، مما يمكّن النماذج اللغوية الكبيرة من تشغيل المتصفحات وتنفيذ مهام أتمتة الويب المعقدة بطريقة أكثر كفاءة ودقة.

الوظائف والميزات الأساسية

🚀 المزايا التقنية الأساسية

  • سريع وخفيف الوزن: يستخدم هيكل شجرة إمكانية الوصول في Playwright، بدلاً من طرق الإدخال القائمة على البكسل.
  • صديق للنماذج اللغوية الكبيرة: يعمل على البيانات المنظمة بشكل خالص، دون الحاجة إلى نماذج بصرية.
  • تطبيق أدوات حتمي: يتجنب المشكلات الغامضة الشائعة في الطرق القائمة على لقطات الشاشة.
  • موثوقية عالية: يوفر نتائج أتمتة مستقرة وقابلة للتنبؤ.

📋 سيناريوهات التطبيق الرئيسية

  1. التنقل في صفحات الويب وملء النماذج

    • أتمتة تصفح الويب
    • ملء بيانات النموذج الذكي
    • عمليات تدفق متعددة الخطوات
  2. استخراج بيانات المحتوى المنظمة

    • استخراج بيانات الويب
    • تحليل المحتوى واستخراجه
    • معالجة هيكلة البيانات
  3. الاختبار الآلي المدفوع بالنماذج اللغوية الكبيرة

    • إنشاء حالات اختبار ذكية
    • اختبار الانحدار الآلي
    • محاكاة سلوك المستخدم
  4. تفاعل المتصفح العام للوكلاء

    • تشغيل وكلاء الذكاء الاصطناعي لصفحات الويب
    • أتمتة سير العمل
    • مساعد صفحات الويب الذكي

التثبيت والتكوين

تثبيت التكامل مع VS Code

الطريقة الأولى: طريقة ملف التكوين

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest"
      ]
    }
  }
}

الطريقة الثانية: التثبيت عبر سطر الأوامر

# VS Code
code --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'

# VS Code Insiders
code-insiders --add-mcp '{"name":"playwright","command":"npx","args":["@playwright/mcp@latest"]}'

أوضاع التشغيل

وضع الرأس (افتراضي)

وضع المتصفح القياسي مع واجهة، مناسب للتطوير والتصحيح:

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": ["@playwright/mcp@latest"]
    }
  }
}

وضع بدون رأس

مناسب لعمليات الخلفية أو معالجة الدفعات:

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest",
        "--headless"
      ]
    }
  }
}

وضع نقل SSE

يستخدم للأنظمة التي لا تحتوي على شاشة عرض أو عمليات عمل IDE:

npx @playwright/mcp@latest --port 8931

ملف التكوين:

{
  "mcpServers": {
    "playwright": {
      "url": "http://localhost:8931/sse"
    }
  }
}

شرح تفصيلي لأوضاع التفاعل

وضع اللقطة (موصى به افتراضيًا)

  • يستخدم لقطات إمكانية الوصول
  • أداء وموثوقية أفضل
  • تفاعل البيانات المنظمة

الوضع البصري

  • يستخدم لقطات الشاشة للتفاعل البصري
  • مناسب للعمليات التي تتطلب الاعتماد على الرؤية
  • يتطلب نماذج تدعم استخدام الكمبيوتر

تمكين الوضع البصري:

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": [
        "@playwright/mcp@latest",
        "--vision"
      ]
    }
  }
}

واجهات برمجة تطبيقات الأدوات المتاحة

أدوات التفاعل الأساسية

عمليات الصفحة

  • browser_click - تنفيذ عملية النقر
  • browser_hover - تحويم العنصر
  • browser_drag - عملية السحب والإفلات
  • browser_type - إدخال النص
  • browser_select_option - تحديد خيار القائمة المنسدلة

التحكم في التنقل

  • browser_navigate - التنقل إلى عنوان URL
  • browser_navigate_back - رجوع
  • browser_navigate_forward - تقدم

إدارة علامات التبويب

  • browser_tab_list - سرد جميع علامات التبويب
  • browser_tab_new - إنشاء علامة تبويب جديدة
  • browser_tab_select - تحديد علامة التبويب
  • browser_tab_close - إغلاق علامة التبويب

أدوات الوظائف المتقدمة

التقاط المحتوى

  • browser_snapshot - لقطة إمكانية الوصول (موصى بها)
  • browser_take_screenshot - لقطة شاشة للصفحة
  • browser_screen_capture - التقاط الشاشة

عمليات الملفات

  • browser_file_upload - تحميل الملف
  • browser_pdf_save - حفظ بتنسيق PDF

تفاعل النظام

  • browser_press_key - عملية الضغط على المفاتيح
  • browser_handle_dialog - معالجة مربعات حوار المتصفح
  • browser_resize - تغيير حجم النافذة
  • browser_wait - الانتظار لفترة محددة

عمليات إحداثيات الشاشة (الوضع البصري)

  • browser_screen_move_mouse - تحريك الماوس
  • browser_screen_click - النقر على الإحداثيات
  • browser_screen_drag - سحب الشاشة
  • browser_screen_type - إدخال الشاشة

أدوات التصحيح

  • browser_console_messages - الحصول على رسائل وحدة التحكم
  • browser_install - تثبيت المتصفح

إدارة بيانات المستخدم

يقوم Playwright MCP بإنشاء ملف تعريف المتصفح في المواقع التالية:

  • Windows: %USERPROFILE%\AppData\Local\ms-playwright\mcp-chrome-profile
  • macOS: ~/Library/Caches/ms-playwright/mcp-chrome-profile
  • Linux: ~/.cache/ms-playwright/mcp-chrome-profile

سيتم تخزين جميع معلومات تسجيل الدخول في ملف التعريف هذا، ويمكنك حذفه بين الجلسات لمسح حالة عدم الاتصال.

التكامل البرمجي

بالنسبة للسيناريوهات التي تتطلب تكاملاً برمجيًا، يمكنك استخدام الطرق التالية:

import { createServer } from '@playwright/mcp';

const server = createServer({
  launchOptions: { headless: true }
});

transport = new SSEServerTransport("/messages", res);
server.connect(transport);

ملخص

يمثل مشروع Microsoft Playwright MCP ابتكارًا مهمًا في مجال أتمتة متصفح وكلاء الذكاء الاصطناعي، فهو يعيد تعريف طريقة تفاعل النماذج اللغوية الكبيرة مع الويب من خلال المزايا الرئيسية التالية:

🎯 نقاط الابتكار التقني

  1. نموذج التفاعل المنظم: التخلي عن طريقة لقطات الشاشة + التعرف البصري التقليدية، واعتماد هيكل شجرة إمكانية الوصول، لتوفير تجربة تفاعل أكثر دقة وكفاءة.

  2. تصميم أصلي للنماذج اللغوية الكبيرة: مُحسَّن خصيصًا للنماذج اللغوية الكبيرة، ولا يتطلب قدرات معالجة بصرية إضافية، مما يقلل من تعقيد النظام واستهلاك الموارد.

  3. دعم Microsoft الرسمي: كمشروع رسمي من Microsoft، يوفر موثوقية على مستوى المؤسسات وضمانات صيانة مستمرة.

🌟 قيمة التطبيق

  • تحسين كفاءة التطوير: يوفر للمطورين أدوات قوية للاختبار الآلي وتشغيل صفحات الويب.
  • تعزيز وكلاء الذكاء الاصطناعي: يمنح وكلاء الذكاء الاصطناعي القدرة على تشغيل صفحات الويب بشكل عملي حقيقي.
  • تحسين فعالية التكلفة: يقلل من متطلبات موارد الحوسبة من خلال طريقة منظمة.

🚀 آفاق مستقبلية

يمثل هذا المشروع الاتجاه المستقبلي لتفاعل الذكاء الاصطناعي مع الويب، ومع التحسين المستمر لنظام MCP البيئي، من المتوقع أن يلعب دورًا مهمًا في المجالات التالية:

  • خدمة العملاء الذكية وأتمتة دعم المستخدم
  • المعالجة الذكية لعمليات الأعمال المعقدة
  • جمع وتحليل بيانات الويب على نطاق واسع
  • الاختبار الآلي للتطبيقات عبر الأنظمة الأساسية

Microsoft Playwright MCP ليس مجرد أداة تقنية، بل هو معلم هام في توسيع حدود قدرات وكلاء الذكاء الاصطناعي، ويوفر أساسًا تقنيًا قويًا لبناء تطبيقات ذكاء اصطناعي أكثر ذكاءً وعملية.

Star History Chart