II-Agent هو مساعد ذكي مفتوح المصدر يهدف إلى تبسيط وتحسين سير العمل عبر مجالات متعددة. إنه يمثل تقدمًا كبيرًا في طريقة تفاعلنا مع التكنولوجيا - من الأدوات السلبية إلى الأنظمة الذكية القادرة على تنفيذ مهام معقدة بشكل مستقل.
عنوان المشروع: https://github.com/Intelligent-Internet/ii-agent
تم بناء II-Agent حول توفير واجهة وكيل لنموذج Anthropic Claude، ويوفر الوظائف التالية:
المجال | وظائف II-Agent |
---|---|
البحث والتحقق من الحقائق | بحث متعدد الخطوات على الإنترنت، والتحقق الثلاثي من مصادر المعلومات، وتدوين ملاحظات منظمة، وملخصات سريعة |
إنشاء المحتوى | مسودات المدونات والمقالات، وخطط الدروس، والمقالات الإبداعية، والأدلة الفنية، وإنشاء مواقع الويب |
تحليل البيانات والتصور | تنظيف البيانات، والتحليل الإحصائي، واكتشاف الاتجاهات، وإنشاء الرسوم البيانية، وإنشاء التقارير التلقائي |
تطوير البرمجيات | توليد التعليمات البرمجية، وإعادة الهيكلة، وتصحيح الأخطاء، وكتابة الاختبارات، والبرامج التعليمية متعددة اللغات خطوة بخطوة |
أتمتة سير العمل | إنشاء البرامج النصية، وأتمتة المتصفح، وإدارة الملفات، وتحسين العمليات |
حل المشكلات | تقسيم المشكلات، واستكشاف المسارات البديلة، والتوجيه خطوة بخطوة، واستكشاف الأخطاء وإصلاحها |
يعتمد نظام II-Agent على منهجية معقدة لبناء وكيل ذكاء اصطناعي متعدد الاستخدامات، وتشمل الأساليب الأساسية ما يلي:
تم تقييم II-Agent على معيار GAIA، الذي يقيم الوكلاء القائمين على LLM الذين يعملون في سيناريوهات واقعية، ويغطي أبعادًا متعددة، بما في ذلك معالجة الوسائط المتعددة واستخدام الأدوات والبحث على الإنترنت.
تم اكتشاف العديد من المشكلات في معيار GAIA أثناء عملية التقييم:
على الرغم من هذه التحديات، فقد أظهر II-Agent أداءً ممتازًا في المعيار، خاصة في المجالات التي تتطلب استدلالًا معقدًا واستخدام الأدوات والتخطيط متعدد الخطوات.
قم بإنشاء ملف .env
في الدليل الجذر:
# أدوات إنشاء الصور والفيديو
OPENAI_API_KEY=your_openai_key
OPENAI_AZURE_ENDPOINT=your_azure_endpoint
# مزود البحث
TAVILY_API_KEY=your_tavily_key
#JINA_API_KEY=your_jina_key
#FIRECRAWL_API_KEY=your_firecrawl_key
# للبحث عن الصور ونتائج بحث أفضل، استخدم SerpAPI
#SERPAPI_API_KEY=your_serpapi_key
STATIC_FILE_BASE_URL=http://localhost:8000/
# إذا كنت تستخدم عميل Anthropic
ANTHROPIC_API_KEY=
# إذا كنت تستخدم Google Vertex (موصى به، إذا كان لديك إذن، يمكنك الحصول على إنتاجية إضافية)
#GOOGLE_APPLICATION_CREDENTIALS=
تكوين بيئة الواجهة الأمامية، قم بإنشاء ملف .env
في دليل frontend:
NEXT_PUBLIC_API_URL=http://localhost:8000
استنساخ المستودع
إعداد بيئة Python:
python -m venv .venv
source .venv/bin/activate # Windows: .venv\Scripts\activate
pip install -e .
cd frontend
npm install
باستخدام عميل Anthropic:
python cli.py
باستخدام Vertex:
python cli.py --project-id YOUR_PROJECT_ID --region YOUR_REGION
خيارات CLI:
--project-id
: معرف مشروع Google Cloud--region
: منطقة Google Cloud (مثل us-east5)--workspace
: مسار دليل مساحة العمل (افتراضي: ./workspace)--needs-permission
: يتطلب إذنًا قبل تنفيذ الأوامر--minimize-stdout-logs
: تقليل كمية السجلات المطبوعة على stdoutباستخدام عميل Anthropic:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000
باستخدام Vertex:
export STATIC_FILE_BASE_URL=http://localhost:8000
python ws_server.py --port 8000 --project-id YOUR_PROJECT_ID --region YOUR_REGION
cd frontend
npm run dev
cli.py
: واجهة سطر الأوامرws_server.py
: خادم WebSocket للواجهة الأماميةsrc/ii_agent/
: التنفيذ الأساسي للوكيلagents/
: تنفيذ الوكيلllm/
: واجهة عميل LLMtools/
: تنفيذ الأدواتutils/
: وظائف مساعدةتم تصميم إطار عمل II-Agent حول القدرات الاستنتاجية لنماذج اللغة الكبيرة مثل Claude 3.7 Sonnet، ويقدم منهجية شاملة وقوية لبناء وكلاء ذكاء اصطناعي متعددين الاستخدامات. من خلال الجمع بين LLM القوي ومجموعة غنية من قدرات التنفيذ وآليات التخطيط والتفكير الواضحة واستراتيجيات إدارة السياق الذكية، فإن II-Agent قادر على التعامل مع مجموعة واسعة من المهام المعقدة متعددة الخطوات.
يمثل II-Agent تقدمًا كبيرًا في تكنولوجيا الوكلاء الأذكياء، وتوفر طبيعته مفتوحة المصدر وتصميمه القابل للتطوير أساسًا متينًا للبحث والتطوير المستمر في مجال الذكاء الاصطناعي للوكلاء سريع التطور. من خلال قدراته التطبيقية متعددة المجالات وهيكله التقني القوي، يوفر II-Agent للمستخدمين منصة مساعدة ذكية شاملة وسهلة الاستخدام.