مساعد بحثي مفتوح المصدر يعتمد على الذكاء الاصطناعي لإجراء أبحاث متعمقة تلقائيًا وإنشاء تقارير شاملة.

MITPythonopen_deep_researchlangchain-ai 7.2k Last Updated: August 06, 2025

تفاصيل مشروع Open Deep Research

نظرة عامة على المشروع

Open Deep Research هو مساعد بحث عميق تجريبي ومفتوح المصدر بالكامل، تم تطويره بواسطة LangChain AI، قادر على أتمتة البحث العميق وإنشاء تقارير شاملة حول أي موضوع. الهدف الأساسي للمشروع هو توفير حل مفتوح المصدر بسيط وقابل للتكوين، ينافس منتجات البحث العميق من شركات مثل OpenAI وAnthropic وPerplexity وGoogle.

الميزات الأساسية

🎯 تصميم معماري مزدوج

يقدم المشروع طريقتين مختلفتين للتنفيذ، لكل منهما مزاياه:

  1. هندسة سير العمل (Workflow Architecture)

    • سير عمل منظم للتخطيط والتنفيذ.
    • حلقة تفاعل بين الإنسان والآلة، تسمح بتلقي ملاحظات المستخدم والموافقة على خطة التقرير.
    • إنشاء قسم تلو الآخر، مع التفكير بين تكرارات البحث.
    • يدعم جميع مزودي أدوات البحث.
  2. هندسة العوامل المتعددة (Multi-Agent Architecture)

    • هندسة المشرف-الباحث.
    • عوامل مستقلة متعددة تعمل بالتوازي.
    • تقليل كبير في وقت إنشاء التقرير.
    • تصميم أدوات متخصص.

🔧 قابلية تهيئة عالية

يوفر Open Deep Research خيارات تهيئة واسعة لتخصيص عملية البحث وسلوك النموذج. يمكن تعيين جميع التهيئة عبر واجهة المستخدم الويب (Web UI)، أو متغيرات البيئة، أو التعديل المباشر للتهيئة:

  • Max Structured Output Retries (الافتراضي: 3): الحد الأقصى لعدد مرات إعادة محاولة استدعاء الإخراج المهيكل.
  • Allow Clarification (الافتراضي: true): ما إذا كان يُسمح للباحث بطرح أسئلة توضيحية قبل بدء البحث.
  • Max Concurrent Research Units (الافتراضي: 5): الحد الأقصى لعدد وحدات البحث التي تعمل بالتوازي باستخدام العوامل الفرعية.
  • Search API (الافتراضي: Tavily): يدعم خيارات متعددة لواجهة برمجة تطبيقات البحث.
  • Max Researcher Iterations (الافتراضي: 3): عدد المرات التي يفكر فيها مشرف البحث في البحث ويطرح أسئلة متابعة.

🤖 دعم نماذج متعددة

يستخدم Open Deep Research نماذج متخصصة متعددة لمهام البحث المختلفة:

  • نموذج التلخيص (الافتراضي: openai:gpt-4.1-nano): لتلخيص نتائج البحث من واجهة برمجة تطبيقات البحث.
  • نموذج البحث (الافتراضي: openai:gpt-4.1): لإجراء البحث والتحليل.
  • نموذج الضغط (الافتراضي: openai:gpt-4.1-mini): لضغط نتائج البحث من العوامل الفرعية.
  • نموذج التقرير النهائي (الافتراضي: openai:gpt-4.1): لكتابة التقرير الشامل النهائي.

يتم تهيئة جميع النماذج باستخدام واجهة برمجة تطبيقات init_chat_model()، وتدعم مزودين مثل OpenAI وAnthropic وGoogle Vertex AI.

🔍 تكامل غني لأدوات البحث

يدعم المشروع واجهات برمجة تطبيقات بحث متعددة:

  • Tavily API - بحث ويب عام
  • Perplexity API - بحث ويب عام
  • Exa API - بحث شبكي عصبي قوي
  • ArXiv - أوراق أكاديمية في الفيزياء والرياضيات وعلوم الكمبيوتر وغيرها
  • PubMed - الأدبيات الطبية الحيوية
  • Linkup API - بحث ويب عام
  • DuckDuckGo API - بحث ويب عام
  • Google Search API - محرك بحث مخصص

البنية التقنية

مبني على LangGraph

تم بناء Open Deep Research على LangGraph، وهو إطار عمل لبناء رسوم بيانية مرنة للعوامل اللغوية. تتيح هذه البنية للمشروع ما يلي:

  • تطبيق مرن لاستراتيجيات بحث مختلفة.
  • استخدام النتائج الوسيطة لتوجيه الاستكشاف.
  • التعامل مع مهام البحث المفتوحة.

عملية بحث من ثلاث خطوات

يستخدم Open Deep Research العوامل كجزء من عملية من ثلاث خطوات لإجراء البحث:

  1. تحديد النطاق (Scoping)

    • توضيح المستخدم: جمع كل سياق المستخدم المطلوب للبحث.
    • توليد الملخص: تحويل التفاعلات التفصيلية في الدردشة إلى ملخص بحث شامل ومركز.
  2. البحث (Research)

    • إجراء البحث باستخدام عامل مشرف.
    • تفويض مهام البحث إلى العدد المناسب من العوامل الفرعية.
    • تحديد ما إذا كان يمكن تقسيم ملخص البحث إلى مواضيع فرعية مستقلة.
  3. توليد التقرير (Report Generation)

    • كتابة التقرير دفعة واحدة.
    • تجنب صعوبات التنسيق في الكتابة المتوازية للعوامل المتعددة.

التثبيت والاستخدام

البدء السريع

# استنساخ المستودع
git clone https://github.com/langchain-ai/open_deep_research.git
cd open_deep_research

# إعداد متغيرات البيئة
cp .env.example .env

# تثبيت وتشغيل خادم LangGraph
uvx --refresh --from "langgraph-cli[inmem]" --with-editable . --python 3.11 langgraph dev --allow-blocking

التثبيت كحزمة بايثون

pip install open-deep-research

طريقة الاستخدام

  1. عبر واجهة المستخدم Studio UI:

  2. Jupyter Notebook:

    • عرض الأمثلة: src/open_deep_research/graph.ipynb
    • مثال العوامل المتعددة: src/open_deep_research/multi_agent.ipynb

تكامل المنصات

منصة Open Agent (OAP)

منصة Open Agent (OAP) هي واجهة مستخدم يمكن للمستخدمين غير التقنيين من خلالها بناء وتهيئة عواملهم الخاصة. OAP مناسبة جدًا لتمكين المستخدمين من تهيئة باحثي البحث العميق، باستخدام أدوات MCP المختلفة وواجهات برمجة تطبيقات البحث التي تناسب احتياجاتهم.

الأداء والتقييم

نتائج الاختبارات المعيارية

وفقًا للنتائج، يحسن Open Deep Research باستمرار جودة الإجابات بشكل كبير على النماذج الأساسية، وهو ما يتجلى في نماذج Llama وDeepSeek وQwen الرائدة، مما يدل على جودة سير العمل.

ميزات الاختبار

# اختبار باستخدام نموذج Anthropic الافتراضي
python tests/run_test.py --all

# اختبار باستخدام نموذج OpenAI o3
python tests/run_test.py --all \
  --supervisor-model "openai:o3" \
  --researcher-model "openai:o3" \
  --planner-provider "openai" \
  --planner-model "o3" \
  --writer-provider "openai" \
  --writer-model "o3" \
  --eval-model "openai:o3" \
  --search-api "tavily"

خيارات النشر

  • النشر المحلي: التشغيل محليًا عبر خادم LangGraph.
  • النشر السحابي: يمكن نشره بسهولة على منصة LangGraph.

النظام البيئي للمشروع

المشاريع ذات الصلة

  • local-deep-researcher: مساعد بحث وكتابة تقارير ويب محلي بالكامل.
  • LangGraph: إطار عمل لبناء رسوم بيانية مرنة للعوامل اللغوية.
  • LangChain: لبناء تطبيقات استدلال واعية بالسياق.

المجتمع والمصدر المفتوح

منذ إطلاق OpenAI، بذل مجتمع المصدر المفتوح جهودًا رائعة في تطوير بدائل للبحث العميق. يهدف هذا المشروع إلى تزويد المجتمع بمجموعة أدوات بحث عميق مفتوحة المصدر يمكن الوصول إليها.

المتطلبات التقنية

توافق النموذج

  1. دعم الإخراج المهيكل: يجب أن تدعم جميع النماذج الإخراج المهيكل.
  2. دعم استدعاء الأدوات: تحتاج نماذج العوامل إلى دعم استدعاء الأدوات.
  3. توافق واجهة برمجة تطبيقات البحث: يجب أن تدعم نماذج البحث والضغط واجهة برمجة تطبيقات البحث المختارة.

النماذج التي تم اختبارها

  • Claude 3.7
  • o3 و o3-mini
  • gpt-4.1
  • llama-3.3-70b-versatile (عبر Groq)

المزايا والميزات

مبادئ التصميم

أحد مبادئ التصميم الرئيسية لـ Open Deep Research هو المرونة، والقدرة على استكشاف استراتيجيات بحث مختلفة بناءً على الطلب. العوامل مناسبة جدًا للبحث لأنها يمكن أن تطبق استراتيجيات مختلفة بمرونة، وتستخدم النتائج الوسيطة لتوجيه الاستكشاف.

المزايا الأساسية

  1. شفافية المصدر المفتوح: مفتوح المصدر بالكامل، يمكن للمجتمع مراجعته وتحسينه.
  2. قابلية تهيئة عالية: يدعم تخصيص النماذج وأدوات البحث وهيكل التقرير.
  3. دعم معماري متعدد: يوفر طريقتين للتنفيذ: سير العمل والعوامل المتعددة.
  4. توافق واسع: يدعم العديد من مزودي نماذج الذكاء الاصطناعي وواجهات برمجة تطبيقات البحث.
  5. تفاعل الإنسان والآلة: يدعم ملاحظات المستخدم والموافقة على خطة التقرير.
  6. تصميم متخصص: يستخدم نماذج متخصصة لمهام مختلفة.

التطورات المستقبلية

المشروع في تطور مستمر، ومن المخطط إضافة المزيد من الميزات والتحسينات:

  • توسيع دعم هندسة العوامل المتعددة ليشمل المزيد من أدوات البحث.
  • تحسين جودة توليد التقرير.
  • تعزيز تجربة تفاعل المستخدم.
  • تحسين الأداء واستخدام الموارد.

الخلاصة

يمثل Open Deep Research تقدمًا مهمًا في أدوات البحث بالذكاء الاصطناعي مفتوحة المصدر، فهو لا يوفر وظائف تنافس المنتجات التجارية فحسب، بل يحافظ أيضًا على شفافية وقابلية تخصيص مشاريع المصدر المفتوح. سواء كنت باحثًا أو مطورًا أو مستخدمًا تجاريًا، يمكنك تخصيص ونشر مساعد البحث القوي هذا وفقًا لاحتياجاتك.

Star History Chart