GraphRAG (الرسوم البيانية + التوليد المعزز بالاسترجاع) هو مشروع مفتوح المصدر تم تطويره بواسطة Microsoft Research، وهو نظام معياري قائم على الرسم البياني لتوليد معزز بالاسترجاع. يجمع المشروع بين استخراج النصوص وتحليل الشبكات وتوجيه النماذج اللغوية الكبيرة (LLM) وتوليد الملخصات لتشكيل نظام شامل مصمم خصيصًا لفهم مجموعات البيانات النصية بعمق.
يستخدم GraphRAG نماذج لغوية كبيرة (LLM) لاستخراج رسوم بيانية معرفية غنية تلقائيًا من أي مجموعة من المستندات النصية. إحدى أكثر الميزات إثارة لقاعدة بيانات الرسوم البيانية هذه هي قدرتها على الإبلاغ عن البنية الدلالية للبيانات قبل أي استعلام من المستخدم.
لا يقوم النظام باستخراج الكيانات والعلاقات فحسب، بل يقوم أيضًا ببناء تسلسل هرمي للمجتمع، وإنشاء ملخصات لهذه المجتمعات، ثم يستخدم هذه الهياكل عند تنفيذ المهام المستندة إلى RAG.
من خلال إنشاء رسم بياني معرفي يعتمد على مجموعة النصوص المدخلة، يحسن GraphRAG بشكل كبير جزء "الاسترجاع" في RAG، ويملأ نافذة السياق بمحتوى ذي صلة أعلى، مما يؤدي إلى إجابات أفضل والتقاط مصادر الأدلة.
مشروع GraphRAG هو خط أنابيب بيانات ومجموعة تحويل مصممة خصيصًا للاستفادة من قوة النماذج اللغوية الكبيرة لاستخراج بيانات منظمة ذات مغزى من نص غير منظم.
يوفر المشروع واجهة سطر أوامر (CLI) وحلول مسرع GraphRAG، مما يبسط تجربة المستخدم للمطورين والمستخدمين.
يقوم GraphRAG بإنشاء العديد من مخرجات الإنتاج لتخزين نماذج المعرفة المفهرسة، وسيتم تحديث هذه المخرجات وتكرارها في الإصدارات المستقبلية.
يعتبر GraphRAG مناسبًا بشكل خاص للسيناريوهات التي تتطلب اكتشاف أنماط وعلاقات معقدة من كميات كبيرة من البيانات النصية، وهو قادر على الإجابة على الأسئلة العالمية التي يصعب على أنظمة RAG التقليدية التعامل معها.
بالنسبة لمجموعات البيانات الخاصة التي تحتوي على محتوى سردي غني، يمكن لـ GraphRAG إطلاق العنان لقدرات LLM في اكتشاف هذه البيانات.
يمكن للنظام إنشاء أسئلة بحثية وتحسين قواعد المعرفة وتحسين مطالبات المستخدم وإنشاء أدوات تعمل على تحسين ذكاء وكلاء الذكاء الاصطناعي.
يوفر المشروع خيارًا بسيطًا للتثبيت من PyPI، بما في ذلك مثال كامل وشامل يوضح كيفية استخدام النظام لفهرسة النص واستخدام البيانات المفهرسة للإجابة على الأسئلة المتعلقة بالمستندات.
graphrag init
.env
و settings.yaml
يدعم النظام إدخال تنسيقات نصية متعددة، وهو قادر على معالجة مجموعات كبيرة من المستندات وإنشاء الرسوم البيانية المعرفية المقابلة.
كمشروع مفتوح المصدر، يعزز GraphRAG التعاون والتطوير في الأوساط الأكاديمية والصناعية في مجال تقنيات RAG المعززة بالرسوم البيانية.
يمثل Microsoft GraphRAG تقدمًا كبيرًا في تقنية التوليد المعزز بالاسترجاع، ومن خلال الجمع بين الرسوم البيانية المعرفية والنماذج اللغوية الكبيرة، فإنه يحسن بشكل كبير من قدرات فهم النصوص وأنظمة الإجابة على الأسئلة. إنه ليس مجرد أداة تقنية، بل هو معلم هام يدفع الذكاء الاصطناعي إلى الأمام في مجال تحليل النصوص المعقدة.