karpathy/llm-council View GitHub Homepage for Latest Official Releases

أداة تعاون متعددة النماذج اللغوية الكبيرة (LLM) تستعلم عن نماذج الذكاء الاصطناعي المتعددة، وتتيح مراجعة الأقران، وتجمع الاستجابات من خلال نموذج رئيس.

Pythonllm-councilkarpathy 14.1k Last Updated: November 22, 2025

مجلس نماذج اللغات الكبيرة - منصة تعاون الذكاء الاصطناعي متعددة النماذج

نظرة عامة على المشروع

مجلس نماذج اللغات الكبيرة هو مشروع مفتوح المصدر مبتكر أنشأه أندريه كارباثي، يحول تفاعلات الذكاء الاصطناعي أحادية النموذج إلى أنظمة توافقية تعاونية متعددة النماذج. بدلاً من الاعتماد على مزود نموذج لغوي كبير واحد، تقوم هذه الأداة بتنسيق نماذج الذكاء الاصطناعي الرائدة المتعددة للعمل معًا، ومراجعة مخرجات بعضها البعض، وإنتاج استجابات مركبة من خلال عملية ديمقراطية.

المفهوم الأساسي

الفكرة الأساسية وراء مجلس نماذج اللغات الكبيرة هي الاستفادة من نقاط قوة نماذج الذكاء الاصطناعي المختلفة مع تقليل التحيزات الفردية للنموذج. من خلال إنشاء "مجلس استشاري للذكاء الاصطناعي"، يتلقى المستخدمون إجابات أكثر شمولاً ومراجعة من قبل النظراء على الأسئلة المعقدة بدلاً من الاعتماد على منظور نموذج واحد.

الهندسة المعمارية وسير العمل

عملية من ثلاث مراحل

المرحلة الأولى: الآراء الأولية

يتم إرسال استعلام المستخدم في وقت واحد إلى جميع نماذج أعضاء المجلس عبر واجهة برمجة تطبيقات OpenRouter
يولد كل نموذج لغوي كبير استجابته المستقلة دون رؤية مخرجات الآخرين
يتم عرض الاستجابات الفردية في عرض علامات تبويب للمقارنة جنبًا إلى جنب
يشتمل المجلس الافتراضي على: GPT-5.1 و Gemini 3.0 Pro و Claude Sonnet 4.5 و Grok 4

المرحلة الثانية: مراجعة النظراء المجهولة

يتلقى كل نموذج استجابات مجهولة المصدر من جميع أعضاء المجلس الآخرين
تقوم النماذج بتقييم وترتيب كل استجابة بناءً على الدقة والرؤية الثاقبة
يمنع إخفاء الهوية التحيز والمحاباة في التقييمات
يكشف التقييم عبر النماذج عن أنماط مفاجئة (غالبًا ما تصنف النماذج المنافسين أعلى)

المرحلة الثالثة: تجميع الرئيس

يراجع نموذج لغوي كبير معين كرئيس (قابل للتكوين) جميع الاستجابات الأصلية
يأخذ في الاعتبار تصنيفات وتقييمات مراجعة النظراء
ينتج إجابة نهائية مركبة تتضمن أفضل العناصر
يقدم استجابة شاملة للمستخدم

الحزمة التقنية

الواجهة الخلفية

الإطار: FastAPI (Python 3.10+)
عميل HTTP: httpx غير المتزامن لمكالمات API غير المحظورة
تكامل API: OpenRouter API للوصول متعدد النماذج
التخزين: استمرار المحادثة المستند إلى JSON في data/conversations/
إدارة الحزم: uv لإدارة تبعيات Python الحديثة

الواجهة الأمامية

الإطار: React مع Vite للتطوير السريع والبناء
العرض: react-markdown للإخراج المنسق
واجهة المستخدم: واجهة تشبه ChatGPT مع عروض علامات تبويب لمقارنة النماذج
خادم التطوير: خادم تطوير Vite على المنفذ 5173

الميزات الرئيسية

إرسال متعدد النماذج

تنفيذ الاستعلام المتزامن عبر نماذج رائدة متعددة
عضوية مجلس قابلة للتكوين من خلال backend/config.py
دعم النماذج من OpenAI و Google و Anthropic و xAI والمزيد

مراجعة النظراء الموضوعية

يمنع تقييم الاستجابة المجهولة تحيز النموذج
نظام تصنيف كمي للدقة والرؤية الثاقبة
يكشف عن أنماط مثيرة للاهتمام في تفضيلات وقوة النموذج

توافق مركب

يجمع نموذج الرئيس وجهات نظر متنوعة
ينتج إجابات نهائية متماسكة تتضمن وجهات نظر متعددة
يوازن بين الإسهاب والرؤية الثاقبة والإيجاز

مقارنة شفافة

عرض جنبًا إلى جنب لجميع الاستجابات الفردية
رؤية كاملة لتصنيفات مراجعة النظراء
يمكن للمستخدمين تكوين أحكامهم الخاصة جنبًا إلى جنب مع توافق الذكاء الاصطناعي

استمرار المحادثة

الحفظ التلقائي لسجل المحادثة
تخزين قائم على JSON لسهولة نقل البيانات
القدرة على مراجعة وتحليل جلسات المجلس السابقة

التثبيت والإعداد

المتطلبات الأساسية

Python 3.10 أو أعلى
Node.js و npm
مفتاح OpenRouter API (يتطلب أرصدة مشتراة)

إعداد الواجهة الخلفية

# تثبيت التبعيات باستخدام uv
uv sync

إعداد الواجهة الأمامية

# انتقل إلى دليل الواجهة الأمامية
cd frontend

# تثبيت تبعيات npm
npm install

cd ..

التكوين

إنشاء ملف .env في جذر المشروع:

OPENROUTER_API_KEY=sk-or-v1-your-key-here

تكوين المجلس في backend/config.py:

COUNCIL_MODELS = [
    "openai/gpt-5.1",
    "google/gemini-3-pro-preview",
    "anthropic/claude-sonnet-4.5",
    "x-ai/grok-4",
]
CHAIRMAN_MODEL = "google/gemini-3-pro-preview"

تشغيل التطبيق

الخيار 1: برنامج التشغيل السريع

./start.sh

الخيار 2: التشغيل اليدوي

# الطرفية 1 - الواجهة الخلفية
uv run python -m backend.main

# الطرفية 2 - الواجهة الأمامية
cd frontend
npm run dev

الوصول إلى التطبيق على: http://localhost:5173

حالات الاستخدام

القراءة وتحليل الأدب

حالة الاستخدام الأصلية لكارباثي: قراءة الكتب بوجهات نظر متعددة للذكاء الاصطناعي
تؤكد النماذج المختلفة على جوانب أدبية مختلفة
تحليل مقارن لأنماط التفسير

البحث والتحليل

أسئلة معقدة تتطلب وجهات نظر متعددة
تقييم الوثائق التقنية
تقييم استراتيجية الأعمال

تقييم المحتوى

تحليل المستندات القانونية
تفسير الأوراق العلمية
مراجعة التعليمات البرمجية والكتابة التقنية

مقارنة النماذج

قياس قدرات نماذج اللغات الكبيرة المختلفة
فهم نقاط القوة والضعف في النموذج
تحديد أنماط التحيز عبر مقدمي الخدمات

النتائج المثيرة للاهتمام

التقييم الذاتي للنموذج

غالبًا ما تختار النماذج استجابات المنافسين على أنها متفوقة على استجاباتها الخاصة
يدل على الموضوعية المدهشة في عملية مراجعة النظراء
يكشف عن اختلافات حقيقية في النهج والجودة

أنماط الترتيب

في اختبار كارباثي مع فصول الكتاب:

الفائز بالإجماع: تم تصنيف GPT-5.1 باستمرار على أنه الأكثر تبصرًا
الخاسر بالإجماع: تم تصنيف Claude باستمرار على أنه الأدنى
المستوى المتوسط: Gemini 3 Pro و Grok-4 بين الحدود القصوى

تباين الحكم بين الإنسان والذكاء الاصطناعي

قد لا يتماشى توافق الذكاء الاصطناعي مع تفضيلات الإنسان
أشاد بـ GPT-5.1 لتبصره ولكن انتقد كارباثي بأنه "مطول للغاية"
تم تصنيف Claude على أنه الأدنى من قبل النظراء ولكن يفضله المنشئ للإيجاز
تقدير Gemini للمخرجات المكثفة والمعالجة
يشير إلى أن النماذج قد تفضل الإسهاب على الإيجاز

فلسفة المشروع

نهج "Vibe Coded"

وصف بأنه مشروع اختراق يوم السبت "99٪ vibe coded"
تطوير سريع بمساعدة الذكاء الاصطناعي
لا يوجد التزام دعم طويل الأجل من المنشئ
فلسفة "التعليمات البرمجية زائلة الآن والمكتبات انتهت"

مفتوح المصدر والإلهام

يتم توفيره كما هو لإلهام المجتمع
يتم تشجيع المستخدمين على التعديل عبر نماذج اللغات الكبيرة الخاصة بهم
يمثل بنية مرجعية لتنسيق الذكاء الاصطناعي
يوضح التعلم الجماعي المطبق على نماذج اللغة

الآثار المترتبة على المؤسسات

برامج وسيطة للتنسيق

يكشف عن بنية تنسيق متعدد النماذج
يعالج مخاوف الإغلاق على بائع معين
يوضح جدوى التطبيقات المستقلة عن النموذج

طبقة مراقبة الجودة

تضيف مراجعة النظراء التحقق الغائب في الأنظمة أحادية النموذج
يقلل من التحيزات الفردية للنموذج
يوفر الشفافية في اتخاذ القرارات المتعلقة بالذكاء الاصطناعي

تنفيذ مرجعي

يظهر الحد الأدنى من البنية القابلة للتطبيق للذكاء الاصطناعي الجماعي
يوجه قرارات البناء مقابل الشراء لمنصات المؤسسات
يزيل الغموض عن تعقيد التنسيق متعدد النماذج

القيود والاعتبارات

التكلفة

يتطلب أرصدة OpenRouter API لجميع أعضاء المجلس بالإضافة إلى الرئيس
تزيد مكالمات النماذج المتعددة لكل استعلام من التكاليف التشغيلية
لا يوجد تشغيل مجاني متاح

السرعة

عملية من ثلاث مراحل أبطأ من الاستعلامات أحادية النموذج
تضيف مكالمات API المتعددة زمن انتقال
المفاضلة بين السرعة والجودة / الإجماع

توافر النموذج

يعتمد على كتالوج نموذج OpenRouter
يتطلب مفاتيح API وأرصدة نشطة
يخضع لحدود معدل مزود النموذج

الصيانة

يذكر المنشئ صراحة عدم وجود دعم مستمر
تحسينات مدفوعة بالمجتمع فقط
المستخدمون مسؤولون عن التعديلات والتحديثات

الاعتبارات الفنية

استراتيجية إخفاء الهوية

يتم تعيين معرفات عشوائية (A و B و C و D) للاستجابات
يمنع التحيز القائم على الهوية في مراجعة النظراء
يحافظ على الموضوعية في عملية التقييم

تكامل API

نقطة تكامل واحدة عبر OpenRouter
يلخص واجهات برمجة التطبيقات الفردية للموفر
يبسط التنسيق متعدد النماذج

خصوصية البيانات

يعمل تطبيق الويب المحلي على جهاز المستخدم
يتم تخزين المحادثات محليًا بتنسيق JSON
تمر مكالمات API عبر OpenRouter (طرف ثالث)

المجتمع والنظام البيئي

المشاريع ذات الصلة

إطار عمل Swarms: ينفذ فئة LLMCouncil المستوحاة من هذا المشروع
Hugging Face Spaces: عمليات نشر مجتمعية متاحة
تغطية Medium/VentureBeat: تحليل المؤسسات والآثار المترتبة عليها

مناهج مماثلة

التعلم الجماعي في التعلم الآلي
هندسة مزيج الخبراء
أنظمة الذكاء الاصطناعي متعددة الوكلاء
بروتوكولات الإجماع في الأنظمة الموزعة

التوجهات المستقبلية

في حين أن كارباثي يذكر صراحة عدم وجود تحسينات مخططة، إلا أن الامتدادات المجتمعية المحتملة يمكن أن تشمل:

دعم النموذج الممتد: إضافة المزيد من أعضاء المجلس من مقدمي الخدمات الناشئين
معايير الترتيب المخصصة: أبعاد التقييم المحددة من قبل المستخدم
الاستجابات المتدفقة: عرض في الوقت الفعلي لمخرجات النموذج
التجميع المتقدم: خوارزميات رئيس أكثر تطوراً
تحسين التكلفة: اختيار النموذج الذكي بناءً على نوع الاستعلام
تحليلات الأداء: تتبع دقة النموذج وأنماط التفضيل
واجهات برمجة تطبيقات التكامل: تضمين وظائف المجلس في تطبيقات أخرى

البدء

استنساخ المستودع: git clone https://github.com/karpathy/llm-council
اتبع تعليمات التثبيت أعلاه
قم بتكوين نماذج المجلس المفضلة لديك
ابدأ الاستعلام وقارن وجهات النظر
جرب مجموعات النماذج المختلفة
تحليل أنماط مراجعة النظراء

خاتمة

يمثل مجلس نماذج اللغات الكبيرة نهجًا عمليًا لمعالجة القيود أحادية النموذج من خلال التنسيق الجماعي. على الرغم من تقديمه كمشروع عطلة نهاية أسبوع غير رسمي، إلا أنه يقدم رؤى قيمة حول الهندسة المعمارية متعددة النماذج وآليات مراجعة النظراء ومستقبل برامج التنسيق الوسيطة للذكاء الاصطناعي. بالنسبة للمطورين والباحثين والمؤسسات التي تستكشف ما وراء الحلول أحادية الموفر، يوفر هذا المشروع كلاً من الإلهام والتنفيذ المرجعي الملموس لبناء أنظمة ذكاء اصطناعي أكثر قوة وقائمة على الإجماع.

يوضح النهج البسيط للمشروع - بضع مئات من سطور التعليمات البرمجية التي تحقق تنسيقًا متطورًا متعدد النماذج - أن الحواجز التقنية أمام الذكاء الاصطناعي الجماعي أقل مما يفترضه الكثيرون. لا تكمن التحديات الحقيقية في توجيه المطالبات، ولكن في الحوكمة وإدارة التكاليف وتحديد متى يحسن الإجماع حقًا النتائج على استجابات النموذج الفردية.