DB-GPT هو إطار عمل مفتوح المصدر لتطوير تطبيقات البيانات الأصلية للذكاء الاصطناعي، يدمج AWEL (لغة التعبير عن سير العمل الوكيلي) ونظام متعدد الوكلاء. يهدف المشروع إلى بناء بنية تحتية في مجال النماذج الكبيرة من خلال تطوير قدرات تقنية متنوعة، مثل إدارة النماذج المتعددة (SMMF)، وتحسين تأثير Text2SQL، وإطار عمل RAG والتحسين، والتعاون في إطار عمل متعدد الوكلاء، و AWEL (تنظيم سير عمل الوكيل)، مما يجعل تطبيقات النماذج الكبيرة القائمة على البيانات أبسط وأكثر ملاءمة.
في عصر البيانات 3.0، يمكن للشركات والمطورين بناء تطبيقاتهم المخصصة بأقل قدر ممكن من التعليمات البرمجية، بناءً على النماذج وقواعد البيانات.
RAG هو المجال الأكثر عملية وإلحاحًا في الوقت الحالي. لقد حقق DB-GPT بالفعل إطار عمل قائم على RAG، مما يسمح للمستخدمين باستخدام وظيفة RAG الخاصة بـ DB-GPT لإنشاء تطبيقات قاعدة المعرفة.
الذكاء التجاري التوليدي هو إحدى القدرات الأساسية لمشروع DB-GPT، حيث يوفر تقنية ذكاء البيانات الأساسية لبناء تحليل تقارير المؤسسات ورؤى الأعمال.
يعد الضبط الدقيق للنموذج قدرة لا غنى عنها لأي مؤسسة لتنفيذها في المجالات الرأسية والمجزأة. يوفر DB-GPT إطار عمل كامل للضبط الدقيق، مدمج بسلاسة مع مشروع DB-GPT. في أعمال الضبط الدقيق الأخيرة، تم تحقيق دقة 82.5٪ بناءً على مجموعة بيانات Spider.
يوفر DB-GPT إطار عمل متعدد الوكلاء ذاتي التطور مدفوع بالبيانات، مصمم لاتخاذ القرارات وتنفيذها باستمرار بناءً على البيانات.
مصنع البيانات مسؤول بشكل أساسي عن تنظيف ومعالجة المعرفة والبيانات الموثوقة في عصر النماذج الكبيرة.
دمج مصادر بيانات مختلفة، وربط بيانات الأعمال الإنتاجية بسلاسة بالوظائف الأساسية لـ DB-GPT.
يركز DB-GPT-Hub على تحقيق سير عمل Text-to-SQL عالي الأداء من خلال تطبيق الضبط الدقيق الخاضع للإشراف (SFT) على نماذج اللغة الكبيرة (LLMs).
dbgpts هو المستودع الرسمي، الذي يحتوي على بعض تطبيقات البيانات وعوامل تشغيل AWEL وقوالب سير عمل AWEL والوكلاء الأذكياء المبنية على DB-GPT.
ملحقات DB-GPT، يمكنها تشغيل ملحقات Auto-GPT مباشرة.
يدعم DB-GPT مجموعة واسعة من نماذج اللغة الكبيرة، بما في ذلك:
نماذج مفتوحة المصدر:
نماذج API:
يوفر مشروع DB-GPT سلسلة من الوظائف المصممة لتحسين بناء قاعدة المعرفة، وتحقيق تخزين واسترجاع فعال للبيانات المنظمة وغير المنظمة. تتضمن هذه الوظائف:
يسهل المشروع التفاعل السلس باللغة الطبيعية مع مصادر بيانات متنوعة، بما في ذلك Excel وقواعد البيانات ومستودعات البيانات. إنه يبسط عملية الاستعلام عن المعلومات واسترجاعها من هذه المصادر، مما يمكّن المستخدمين من إجراء محادثات بديهية واكتساب رؤى. بالإضافة إلى ذلك، يدعم DB-GPT إنشاء تقارير تحليلية.
يوفر دعمًا للمكونات الإضافية المخصصة لتنفيذ مهام مختلفة، ويتكامل أصلاً مع نموذج المكونات الإضافية Auto-GPT. يتبع بروتوكول الوكيل معيار بروتوكول الوكيل.
لقد قمنا أيضًا بتطوير إطار عمل خفيف الوزن للضبط الدقيق التلقائي يركز على نماذج اللغة الكبيرة (LLMs) ومجموعات بيانات Text2SQL و LoRA/QLoRA/Pturning وطرق الضبط الدقيق الأخرى. يبسط هذا الإطار الضبط الدقيق لـ Text-to-SQL، مما يجعله بسيطًا مثل عملية خط التجميع.
نحن نقدم دعمًا واسعًا للنماذج، بما في ذلك عشرات نماذج اللغة الكبيرة (LLMs) من مصادر مفتوحة ووكلاء API، مثل LLaMA/LLaMA2 و Baichuan و ChatGLM و 文心 (Wenxin) و 通义 (Tongyi) و 智谱 (Zhipu) وما إلى ذلك.
نحن نضمن خصوصية وأمان البيانات من خلال تنفيذ تقنيات مختلفة، بما في ذلك النماذج الكبيرة الخاصة وإزالة حساسية الوكيل.
في ملف تكوين .env، قم بتعديل معلمة LANGUAGE للتبديل إلى لغة مختلفة. الافتراضي هو اللغة الإنجليزية (الصينية: zh، الإنجليزية: en، سيتم إضافة لغات أخرى لاحقًا).
يعتمد DB-GPT تصميمًا معياريًا، والذي يتضمن بشكل أساسي: