Intelligent-Internet/ii-agentView GitHub Homepage for Latest Official Releases

II-Agent هو إطار عمل مفتوح المصدر للمساعد الذكي، يهدف إلى تبسيط وتحسين سير العمل عبر مجالات متعددة، وقادر على تنفيذ مهام معقدة بشكل مستقل.

Apache-2.0Pythonii-agentIntelligent-Internet 2.8k Last Updated: August 13, 2025

مشروع II-Agent: شرح تفصيلي

نظرة عامة على المشروع

II-Agent هو مساعد ذكي مفتوح المصدر يهدف إلى تبسيط وتحسين سير العمل عبر مجالات متعددة. إنه يمثل تقدمًا كبيرًا في طريقة تفاعلنا مع التكنولوجيا - من الأدوات السلبية إلى الأنظمة الذكية القادرة على تنفيذ مهام معقدة بشكل مستقل.

عنوان المشروع: https://github.com/Intelligent-Internet/ii-agent

الميزات الأساسية

تم بناء II-Agent حول توفير واجهة وكيل لنموذج Anthropic Claude، ويوفر الوظائف التالية:

واجهة سطر الأوامر (CLI): تفاعل مباشر مع سطر الأوامر
خادم WebSocket: يدعم واجهة React أمامية حديثة
تكامل Google Cloud Vertex AI: الوصول إلى نماذج Anthropic عبر واجهة برمجة التطبيقات (API)

مجالات التطبيق والوظائف

المجال	وظائف II-Agent
البحث والتحقق من الحقائق	بحث متعدد الخطوات على الإنترنت، والتحقق الثلاثي من مصادر المعلومات، وتدوين ملاحظات منظمة، وملخصات سريعة
إنشاء المحتوى	مسودات المدونات والمقالات، وخطط الدروس، والمقالات الإبداعية، والأدلة الفنية، وإنشاء مواقع الويب
تحليل البيانات والتصور	تنظيف البيانات، والتحليل الإحصائي، واكتشاف الاتجاهات، وإنشاء الرسوم البيانية، وإنشاء التقارير التلقائي
تطوير البرمجيات	توليد التعليمات البرمجية، وإعادة الهيكلة، وتصحيح الأخطاء، وكتابة الاختبارات، والبرامج التعليمية متعددة اللغات خطوة بخطوة
أتمتة سير العمل	إنشاء البرامج النصية، وأتمتة المتصفح، وإدارة الملفات، وتحسين العمليات
حل المشكلات	تقسيم المشكلات، واستكشاف المسارات البديلة، والتوجيه خطوة بخطوة، واستكشاف الأخطاء وإصلاحها

بنية النظام

يعتمد نظام II-Agent على منهجية معقدة لبناء وكيل ذكاء اصطناعي متعدد الاستخدامات، وتشمل الأساليب الأساسية ما يلي:

1. بنية الوكيل الأساسية والتفاعل مع نماذج اللغة الكبيرة (LLM)

مطالبات نظام مخصصة ديناميكيًا للسياق
إدارة شاملة لتاريخ التفاعل
إدارة ذكية للسياق للتعامل مع قيود الرموز المميزة
استدعاءات LLM منهجية واختيار الوظائف
التحسين التكراري من خلال دورات التنفيذ

2. التخطيط والتفكير

استدلال منظم لحل المشكلات المعقدة
تقسيم المشكلات والتفكير التسلسلي
عملية صنع قرار شفافة
تشكيل الفرضيات واختبارها

3. قدرات التنفيذ

عمليات نظام الملفات مع تحرير ذكي للتعليمات البرمجية
تنفيذ سطر الأوامر في بيئة آمنة
تفاعل متقدم مع الشبكة وأتمتة المتصفح
إكمال المهام والإبلاغ
وظائف مخصصة لأنماط مختلفة (تجريبية): PDF، صوت، صور، فيديو، شرائح
تكامل بحثي متعمق

4. إدارة السياق

تقدير استخدام الرموز المميزة وتحسينها
اقتطاع استراتيجي للتفاعلات الطويلة
أرشفة قائمة على الملفات للإخراجات الكبيرة

5. الاتصال في الوقت الحقيقي

واجهة تفاعلية قائمة على WebSocket
مثيلات وكيل معزولة لكل عميل
أحداث تدفق العمليات لتجربة مستخدم سريعة الاستجابة

تقييم الأداء

تم تقييم II-Agent على معيار GAIA، الذي يقيم الوكلاء القائمين على LLM الذين يعملون في سيناريوهات واقعية، ويغطي أبعادًا متعددة، بما في ذلك معالجة الوسائط المتعددة واستخدام الأدوات والبحث على الإنترنت.

تم اكتشاف العديد من المشكلات في معيار GAIA أثناء عملية التقييم:

أخطاء في التعليقات التوضيحية: العديد من التعليقات التوضيحية غير الصحيحة في مجموعة البيانات
معلومات قديمة: تشير بعض المشكلات إلى مواقع ويب أو محتوى لم يعد متاحًا
غموض لغوي: صياغة غير واضحة تؤدي إلى تفسيرات مختلفة للمشكلات

على الرغم من هذه التحديات، فقد أظهر II-Agent أداءً ممتازًا في المعيار، خاصة في المجالات التي تتطلب استدلالًا معقدًا واستخدام الأدوات والتخطيط متعدد الخطوات.

التثبيت والتكوين

متطلبات النظام

Python 3.10+
Node.js 18+ (للواجهة الأمامية)
مشروع Google Cloud مع تمكين Vertex AI API أو مفتاح Anthropic API

تكوين البيئة

قم بإنشاء ملف .env في الدليل الجذر:

# أدوات إنشاء الصور والفيديو
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint

# مزود البحث
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key

# للبحث عن الصور ونتائج بحث أفضل، استخدم SerpAPI
#SERPAPI_API_KEY=your_serpapi_key

STATIC_FILE_BASE_URL=http://localhost:8000/

# إذا كنت تستخدم عميل Anthropic
ANTHROPIC_API_KEY=

# إذا كنت تستخدم Google Vertex (موصى به، إذا كان لديك إذن، يمكنك الحصول على إنتاجية إضافية)
#GOOGLE_APPLICATION_CREDENTIALS=

تكوين بيئة الواجهة الأمامية، قم بإنشاء ملف .env في دليل frontend:

NEXT_PUBLIC_API_URL=http://localhost:8000

خطوات التثبيت

استنساخ المستودع
إعداد بيئة Python:

python -m venv .venv
source .venv/bin/activate  # Windows: .venv\Scripts\activate
pip install -e .

إعداد الواجهة الأمامية (اختياري):

cd frontend
npm install

طريقة الاستخدام

استخدام CLI

باستخدام عميل Anthropic:

python cli.py

باستخدام Vertex:

python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION

خيارات CLI:

--project-id: معرف مشروع Google Cloud
--region: منطقة Google Cloud (مثل us-east5)
--workspace: مسار دليل مساحة العمل (افتراضي: ./workspace)
--needs-permission: يتطلب إذنًا قبل تنفيذ الأوامر
--minimize-stdout-logs: تقليل كمية السجلات المطبوعة على stdout

استخدام واجهة الويب

تشغيل خادم WebSocket:

باستخدام عميل Anthropic:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000

باستخدام Vertex:

export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION

تشغيل الواجهة الأمامية (في طرفية منفصلة):

cd frontend
npm run dev

افتح المتصفح وقم بزيارة http://localhost:3000

هيكل المشروع

cli.py: واجهة سطر الأوامر
ws_server.py: خادم WebSocket للواجهة الأمامية
src/ii_agent/: التنفيذ الأساسي للوكيل
- agents/: تنفيذ الوكيل
- llm/: واجهة عميل LLM
- tools/: تنفيذ الأدوات
- utils/: وظائف مساعدة

الميزات التقنية

تم تصميم إطار عمل II-Agent حول القدرات الاستنتاجية لنماذج اللغة الكبيرة مثل Claude 3.7 Sonnet، ويقدم منهجية شاملة وقوية لبناء وكلاء ذكاء اصطناعي متعددين الاستخدامات. من خلال الجمع بين LLM القوي ومجموعة غنية من قدرات التنفيذ وآليات التخطيط والتفكير الواضحة واستراتيجيات إدارة السياق الذكية، فإن II-Agent قادر على التعامل مع مجموعة واسعة من المهام المعقدة متعددة الخطوات.

ملخص

يمثل II-Agent تقدمًا كبيرًا في تكنولوجيا الوكلاء الأذكياء، وتوفر طبيعته مفتوحة المصدر وتصميمه القابل للتطوير أساسًا متينًا للبحث والتطوير المستمر في مجال الذكاء الاصطناعي للوكلاء سريع التطور. من خلال قدراته التطبيقية متعددة المجالات وهيكله التقني القوي، يوفر II-Agent للمستخدمين منصة مساعدة ذكية شاملة وسهلة الاستخدام.