أداة تعاون متعددة النماذج اللغوية الكبيرة (LLM) تستعلم عن نماذج الذكاء الاصطناعي المتعددة، وتتيح مراجعة الأقران، وتجمع الاستجابات من خلال نموذج رئيس.
مجلس نماذج اللغات الكبيرة - منصة تعاون الذكاء الاصطناعي متعددة النماذج
نظرة عامة على المشروع
مجلس نماذج اللغات الكبيرة هو مشروع مفتوح المصدر مبتكر أنشأه أندريه كارباثي، يحول تفاعلات الذكاء الاصطناعي أحادية النموذج إلى أنظمة توافقية تعاونية متعددة النماذج. بدلاً من الاعتماد على مزود نموذج لغوي كبير واحد، تقوم هذه الأداة بتنسيق نماذج الذكاء الاصطناعي الرائدة المتعددة للعمل معًا، ومراجعة مخرجات بعضها البعض، وإنتاج استجابات مركبة من خلال عملية ديمقراطية.
المفهوم الأساسي
الفكرة الأساسية وراء مجلس نماذج اللغات الكبيرة هي الاستفادة من نقاط قوة نماذج الذكاء الاصطناعي المختلفة مع تقليل التحيزات الفردية للنموذج. من خلال إنشاء "مجلس استشاري للذكاء الاصطناعي"، يتلقى المستخدمون إجابات أكثر شمولاً ومراجعة من قبل النظراء على الأسئلة المعقدة بدلاً من الاعتماد على منظور نموذج واحد.
الهندسة المعمارية وسير العمل
عملية من ثلاث مراحل
المرحلة الأولى: الآراء الأولية
- يتم إرسال استعلام المستخدم في وقت واحد إلى جميع نماذج أعضاء المجلس عبر واجهة برمجة تطبيقات OpenRouter
- يولد كل نموذج لغوي كبير استجابته المستقلة دون رؤية مخرجات الآخرين
- يتم عرض الاستجابات الفردية في عرض علامات تبويب للمقارنة جنبًا إلى جنب
- يشتمل المجلس الافتراضي على: GPT-5.1 و Gemini 3.0 Pro و Claude Sonnet 4.5 و Grok 4
المرحلة الثانية: مراجعة النظراء المجهولة
- يتلقى كل نموذج استجابات مجهولة المصدر من جميع أعضاء المجلس الآخرين
- تقوم النماذج بتقييم وترتيب كل استجابة بناءً على الدقة والرؤية الثاقبة
- يمنع إخفاء الهوية التحيز والمحاباة في التقييمات
- يكشف التقييم عبر النماذج عن أنماط مفاجئة (غالبًا ما تصنف النماذج المنافسين أعلى)
المرحلة الثالثة: تجميع الرئيس
- يراجع نموذج لغوي كبير معين كرئيس (قابل للتكوين) جميع الاستجابات الأصلية
- يأخذ في الاعتبار تصنيفات وتقييمات مراجعة النظراء
- ينتج إجابة نهائية مركبة تتضمن أفضل العناصر
- يقدم استجابة شاملة للمستخدم
الحزمة التقنية
الواجهة الخلفية
- الإطار: FastAPI (Python 3.10+)
- عميل HTTP: httpx غير المتزامن لمكالمات API غير المحظورة
- تكامل API: OpenRouter API للوصول متعدد النماذج
- التخزين: استمرار المحادثة المستند إلى JSON في
data/conversations/ - إدارة الحزم: uv لإدارة تبعيات Python الحديثة
الواجهة الأمامية
- الإطار: React مع Vite للتطوير السريع والبناء
- العرض: react-markdown للإخراج المنسق
- واجهة المستخدم: واجهة تشبه ChatGPT مع عروض علامات تبويب لمقارنة النماذج
- خادم التطوير: خادم تطوير Vite على المنفذ 5173
الميزات الرئيسية
إرسال متعدد النماذج
- تنفيذ الاستعلام المتزامن عبر نماذج رائدة متعددة
- عضوية مجلس قابلة للتكوين من خلال
backend/config.py - دعم النماذج من OpenAI و Google و Anthropic و xAI والمزيد
مراجعة النظراء الموضوعية
- يمنع تقييم الاستجابة المجهولة تحيز النموذج
- نظام تصنيف كمي للدقة والرؤية الثاقبة
- يكشف عن أنماط مثيرة للاهتمام في تفضيلات وقوة النموذج
توافق مركب
- يجمع نموذج الرئيس وجهات نظر متنوعة
- ينتج إجابات نهائية متماسكة تتضمن وجهات نظر متعددة
- يوازن بين الإسهاب والرؤية الثاقبة والإيجاز
مقارنة شفافة
- عرض جنبًا إلى جنب لجميع الاستجابات الفردية
- رؤية كاملة لتصنيفات مراجعة النظراء
- يمكن للمستخدمين تكوين أحكامهم الخاصة جنبًا إلى جنب مع توافق الذكاء الاصطناعي
استمرار المحادثة
- الحفظ التلقائي لسجل المحادثة
- تخزين قائم على JSON لسهولة نقل البيانات
- القدرة على مراجعة وتحليل جلسات المجلس السابقة
التثبيت والإعداد
المتطلبات الأساسية
- Python 3.10 أو أعلى
- Node.js و npm
- مفتاح OpenRouter API (يتطلب أرصدة مشتراة)
إعداد الواجهة الخلفية
# تثبيت التبعيات باستخدام uv
uv sync
إعداد الواجهة الأمامية
# انتقل إلى دليل الواجهة الأمامية
cd frontend
# تثبيت تبعيات npm
npm install
cd ..
التكوين
- إنشاء ملف
.envفي جذر المشروع:
OPENROUTER_API_KEY=sk-or-v1-your-key-here
- تكوين المجلس في
backend/config.py:
COUNCIL_MODELS = [
"openai/gpt-5.1",
"google/gemini-3-pro-preview",
"anthropic/claude-sonnet-4.5",
"x-ai/grok-4",
]
CHAIRMAN_MODEL = "google/gemini-3-pro-preview"
تشغيل التطبيق
الخيار 1: برنامج التشغيل السريع
./start.sh
الخيار 2: التشغيل اليدوي
# الطرفية 1 - الواجهة الخلفية
uv run python -m backend.main
# الطرفية 2 - الواجهة الأمامية
cd frontend
npm run dev
الوصول إلى التطبيق على: http://localhost:5173
حالات الاستخدام
القراءة وتحليل الأدب
- حالة الاستخدام الأصلية لكارباثي: قراءة الكتب بوجهات نظر متعددة للذكاء الاصطناعي
- تؤكد النماذج المختلفة على جوانب أدبية مختلفة
- تحليل مقارن لأنماط التفسير
البحث والتحليل
- أسئلة معقدة تتطلب وجهات نظر متعددة
- تقييم الوثائق التقنية
- تقييم استراتيجية الأعمال
تقييم المحتوى
- تحليل المستندات القانونية
- تفسير الأوراق العلمية
- مراجعة التعليمات البرمجية والكتابة التقنية
مقارنة النماذج
- قياس قدرات نماذج اللغات الكبيرة المختلفة
- فهم نقاط القوة والضعف في النموذج
- تحديد أنماط التحيز عبر مقدمي الخدمات
النتائج المثيرة للاهتمام
التقييم الذاتي للنموذج
- غالبًا ما تختار النماذج استجابات المنافسين على أنها متفوقة على استجاباتها الخاصة
- يدل على الموضوعية المدهشة في عملية مراجعة النظراء
- يكشف عن اختلافات حقيقية في النهج والجودة
أنماط الترتيب
في اختبار كارباثي مع فصول الكتاب:
- الفائز بالإجماع: تم تصنيف GPT-5.1 باستمرار على أنه الأكثر تبصرًا
- الخاسر بالإجماع: تم تصنيف Claude باستمرار على أنه الأدنى
- المستوى المتوسط: Gemini 3 Pro و Grok-4 بين الحدود القصوى
تباين الحكم بين الإنسان والذكاء الاصطناعي
- قد لا يتماشى توافق الذكاء الاصطناعي مع تفضيلات الإنسان
- أشاد بـ GPT-5.1 لتبصره ولكن انتقد كارباثي بأنه "مطول للغاية"
- تم تصنيف Claude على أنه الأدنى من قبل النظراء ولكن يفضله المنشئ للإيجاز
- تقدير Gemini للمخرجات المكثفة والمعالجة
- يشير إلى أن النماذج قد تفضل الإسهاب على الإيجاز
فلسفة المشروع
نهج "Vibe Coded"
- وصف بأنه مشروع اختراق يوم السبت "99٪ vibe coded"
- تطوير سريع بمساعدة الذكاء الاصطناعي
- لا يوجد التزام دعم طويل الأجل من المنشئ
- فلسفة "التعليمات البرمجية زائلة الآن والمكتبات انتهت"
مفتوح المصدر والإلهام
- يتم توفيره كما هو لإلهام المجتمع
- يتم تشجيع المستخدمين على التعديل عبر نماذج اللغات الكبيرة الخاصة بهم
- يمثل بنية مرجعية لتنسيق الذكاء الاصطناعي
- يوضح التعلم الجماعي المطبق على نماذج اللغة
الآثار المترتبة على المؤسسات
برامج وسيطة للتنسيق
- يكشف عن بنية تنسيق متعدد النماذج
- يعالج مخاوف الإغلاق على بائع معين
- يوضح جدوى التطبيقات المستقلة عن النموذج
طبقة مراقبة الجودة
- تضيف مراجعة النظراء التحقق الغائب في الأنظمة أحادية النموذج
- يقلل من التحيزات الفردية للنموذج
- يوفر الشفافية في اتخاذ القرارات المتعلقة بالذكاء الاصطناعي
تنفيذ مرجعي
- يظهر الحد الأدنى من البنية القابلة للتطبيق للذكاء الاصطناعي الجماعي
- يوجه قرارات البناء مقابل الشراء لمنصات المؤسسات
- يزيل الغموض عن تعقيد التنسيق متعدد النماذج
القيود والاعتبارات
التكلفة
- يتطلب أرصدة OpenRouter API لجميع أعضاء المجلس بالإضافة إلى الرئيس
- تزيد مكالمات النماذج المتعددة لكل استعلام من التكاليف التشغيلية
- لا يوجد تشغيل مجاني متاح
السرعة
- عملية من ثلاث مراحل أبطأ من الاستعلامات أحادية النموذج
- تضيف مكالمات API المتعددة زمن انتقال
- المفاضلة بين السرعة والجودة / الإجماع
توافر النموذج
- يعتمد على كتالوج نموذج OpenRouter
- يتطلب مفاتيح API وأرصدة نشطة
- يخضع لحدود معدل مزود النموذج
الصيانة
- يذكر المنشئ صراحة عدم وجود دعم مستمر
- تحسينات مدفوعة بالمجتمع فقط
- المستخدمون مسؤولون عن التعديلات والتحديثات
الاعتبارات الفنية
استراتيجية إخفاء الهوية
- يتم تعيين معرفات عشوائية (A و B و C و D) للاستجابات
- يمنع التحيز القائم على الهوية في مراجعة النظراء
- يحافظ على الموضوعية في عملية التقييم
تكامل API
- نقطة تكامل واحدة عبر OpenRouter
- يلخص واجهات برمجة التطبيقات الفردية للموفر
- يبسط التنسيق متعدد النماذج
خصوصية البيانات
- يعمل تطبيق الويب المحلي على جهاز المستخدم
- يتم تخزين المحادثات محليًا بتنسيق JSON
- تمر مكالمات API عبر OpenRouter (طرف ثالث)
المجتمع والنظام البيئي
المشاريع ذات الصلة
- إطار عمل Swarms: ينفذ فئة LLMCouncil المستوحاة من هذا المشروع
- Hugging Face Spaces: عمليات نشر مجتمعية متاحة
- تغطية Medium/VentureBeat: تحليل المؤسسات والآثار المترتبة عليها
مناهج مماثلة
- التعلم الجماعي في التعلم الآلي
- هندسة مزيج الخبراء
- أنظمة الذكاء الاصطناعي متعددة الوكلاء
- بروتوكولات الإجماع في الأنظمة الموزعة
التوجهات المستقبلية
في حين أن كارباثي يذكر صراحة عدم وجود تحسينات مخططة، إلا أن الامتدادات المجتمعية المحتملة يمكن أن تشمل:
- دعم النموذج الممتد: إضافة المزيد من أعضاء المجلس من مقدمي الخدمات الناشئين
- معايير الترتيب المخصصة: أبعاد التقييم المحددة من قبل المستخدم
- الاستجابات المتدفقة: عرض في الوقت الفعلي لمخرجات النموذج
- التجميع المتقدم: خوارزميات رئيس أكثر تطوراً
- تحسين التكلفة: اختيار النموذج الذكي بناءً على نوع الاستعلام
- تحليلات الأداء: تتبع دقة النموذج وأنماط التفضيل
- واجهات برمجة تطبيقات التكامل: تضمين وظائف المجلس في تطبيقات أخرى
البدء
- استنساخ المستودع:
git clone https://github.com/karpathy/llm-council - اتبع تعليمات التثبيت أعلاه
- قم بتكوين نماذج المجلس المفضلة لديك
- ابدأ الاستعلام وقارن وجهات النظر
- جرب مجموعات النماذج المختلفة
- تحليل أنماط مراجعة النظراء
خاتمة
يمثل مجلس نماذج اللغات الكبيرة نهجًا عمليًا لمعالجة القيود أحادية النموذج من خلال التنسيق الجماعي. على الرغم من تقديمه كمشروع عطلة نهاية أسبوع غير رسمي، إلا أنه يقدم رؤى قيمة حول الهندسة المعمارية متعددة النماذج وآليات مراجعة النظراء ومستقبل برامج التنسيق الوسيطة للذكاء الاصطناعي. بالنسبة للمطورين والباحثين والمؤسسات التي تستكشف ما وراء الحلول أحادية الموفر، يوفر هذا المشروع كلاً من الإلهام والتنفيذ المرجعي الملموس لبناء أنظمة ذكاء اصطناعي أكثر قوة وقائمة على الإجماع.
يوضح النهج البسيط للمشروع - بضع مئات من سطور التعليمات البرمجية التي تحقق تنسيقًا متطورًا متعدد النماذج - أن الحواجز التقنية أمام الذكاء الاصطناعي الجماعي أقل مما يفترضه الكثيرون. لا تكمن التحديات الحقيقية في توجيه المطالبات، ولكن في الحوكمة وإدارة التكاليف وتحديد متى يحسن الإجماع حقًا النتائج على استجابات النموذج الفردية.