المرحلة الخامسة: استكشاف سيناريوهات تطبيق الذكاء الاصطناعي

دورة تطوير أنظمة الاسترجاع المعزز بالتوليد (RAG) من DeepLearning.AI، تعلم كيفية بناء تطبيقات RAG ذات مستوى إنتاجي باستخدام قواعد بيانات المتجهات ونماذج اللغة الكبيرة (LLM)، تغطي العملية الكاملة من تصميم البنية إلى تقييم النشر.

RAGVectorDatabaseLLMApplicationWebSiteVideoFreeEnglish

مقدمة تفصيلية لدورة التوليد المعزز بالاسترجاع (RAG)

نظرة عامة على الدورة

هذه دورة شاملة حول أنظمة التوليد المعزز بالاسترجاع (RAG) مقدمة من DeepLearning.AI، وتهدف إلى مساعدة المتعلمين على إتقان المعرفة اللازمة لتطوير تطبيقات RAG على مستوى الإنتاج، بدءًا من تصميم البنية وصولاً إلى التقييم والنشر.

منصة الدورة: DeepLearning.AI / Coursera
المحاضر: زين حسن (مهندس AI/ML أول في Together AI، ومحاضر في جامعة تورنتو)
مدة الدورة: 5 ساعات فيديو + أكثر من 20 ساعة تدريب عملي على البرمجة
مستوى الدورة: متوسط
طريقة التعلم: التعلم بالوتيرة الذاتية

نبذة عن المحاضر

زين حسن مهندس ومُعلّم في مجال الذكاء الاصطناعي يتمتع بخبرة تقارب عشر سنوات، وقد عمل في:

  • Together AI: مهندس علاقات تطوير AI/ML
  • Weaviate: عمل في قواعد بيانات المتجهات واسترجاع المعلومات
  • جامعة تورنتو: محاضر، يدرس أنظمة تعلم الآلة
  • لديه خبرة واسعة في الأوساط الأكاديمية، الشركات الناشئة، وصناعة التكنولوجيا
  • شغوف بالبرمجيات مفتوحة المصدر، التعليم، وبناء المجتمعات

أسلوبه التعليمي يشبه التعلم من زميل فريق ذي خبرة، بدلاً من المحاضرات الصفية التقليدية.

المحتوى الأساسي للدورة

ثلاث نقاط تعلم رئيسية

  1. تطبيقات RAG في العالم الحقيقي

    • تعلم كيفية عمل الاسترجاع والتوليد معًا
    • تصميم كل مكون لبناء نظام RAG موثوق ومرن
  2. تقنيات البحث وقواعد بيانات المتجهات

    • البحث بالكلمات المفتاحية (Keyword Search)
    • البحث الدلالي (Semantic Search)
    • البحث الهجين (Hybrid Search)
    • تقنيات التقطيع (Chunking)
    • تحليل الاستعلام (Query Parsing)
    • دعم التطبيقات في مجالات متعددة مثل الرعاية الصحية والتجارة الإلكترونية
  3. تصميم الأوامر، التقييم، والنشر

    • هندسة الأوامر التي تستفيد بالكامل من سياق الاسترجاع
    • تقييم أداء نظام RAG
    • إعداد المسارات لبيئة الإنتاج

مخطط الدورة (5 وحدات)

الوحدة 1: مقدمة إلى RAG

المواضيع:

  • سيناريوهات تطبيق RAG
  • نظرة عامة على بنية RAG
  • مقدمة لأساسيات LLM
  • مقدمة إلى بايثون
  • طرق استدعاء LLM
  • أساسيات استرجاع المعلومات

المشاريع العملية:

  • كتابة دوال الاسترجاع وتعزيز الأوامر
  • بناء أول نظام RAG
  • تمرير مدخلات منظمة إلى LLM

الوحدة 2: استرجاع المعلومات وأسس البحث

المواضيع:

  • نظرة عامة على بنية المسترجع
  • تصفية البيانات الوصفية (Metadata Filtering)
  • البحث بالكلمات المفتاحية (TF-IDF و BM25)
  • البحث الدلالي (Semantic Search)
  • تضمينات المتجهات في RAG
  • البحث الهجين (Hybrid Search)
  • تقييم الاسترجاع والمقاييس

المشاريع العملية:

  • تنفيذ ومقارنة البحث الدلالي، BM25، ودمج الرتب المتبادلة (Reciprocal Rank Fusion)
  • ملاحظة تأثير طرق الاسترجاع المختلفة على استجابات LLM

الوحدة 3: استرجاع المعلومات باستخدام قواعد بيانات المتجهات

المواضيع:

  • خوارزميات ANN (أقرب جار تقريبي)
  • قواعد بيانات المتجهات
  • مقدمة إلى واجهة برمجة تطبيقات Weaviate
  • تقنيات التقطيع (Chunking)
  • تحليل الاستعلام (Query Parsing)
  • المشفرات المتقاطعة (Cross-encoders) و ColBERT
  • إعادة الترتيب (Reranking)

المشاريع العملية:

  • توسيع نظام RAG باستخدام Weaviate ومجموعة بيانات إخبارية حقيقية
  • إجراء تقطيع المستندات، الفهرسة، والاسترجاع

الوحدة 4: نماذج اللغة الكبيرة في RAG

المواضيع:

  • بنية المحولات (Transformer Architecture)
  • استراتيجيات أخذ العينات لـ LLM
  • استكشاف قدرات LLM
  • اختيار LLM المناسب
  • هندسة الأوامر (Prompt Engineering)
  • معالجة مشكلة الهلوسة
  • تقييم أداء LLM
  • RAG الوكيل (Agentic RAG)
  • RAG مقابل الضبط الدقيق (Fine-tuning)

المشاريع العملية:

  • تطوير روبوت محادثة خاص بمتجر ملابس افتراضي
  • الإجابة على الأسئلة الشائعة وتقديم اقتراحات المنتجات بناءً على مجموعة بيانات مخصصة
  • استخدام LLM مفتوح المصدر مستضاف بواسطة Together AI

الوحدة 5: الإنتاج، التقييم، والنشر

المواضيع:

  • تحديات بيئة الإنتاج
  • تنفيذ استراتيجيات تقييم RAG
  • التسجيل، المراقبة، وإمكانية الملاحظة
  • تتبع نظام RAG
  • التقييم المخصص
  • تقنيات التكميم (Quantization)
  • المفاضلة بين التكلفة وجودة الاستجابة
  • المفاضلة بين زمن الاستجابة وجودة الاستجابة
  • الأمان
  • RAG متعدد الوسائط (Multimodal RAG)

المشاريع العملية:

  • التعامل مع تحديات واقعية مثل التسعير الديناميكي
  • تسجيل تفاعلات المستخدم للمراقبة وتصحيح الأخطاء
  • تحسين موثوقية روبوت المحادثة

المكدس التقني والأدوات

الأدوات الأساسية

  • قاعدة بيانات المتجهات: Weaviate
  • منصة LLM: Together AI (LLM مفتوح المصدر)
  • أداة المراقبة: Phoenix (Arize)
  • لغة التطوير: بايثون

التقنيات المتضمنة

- تضمينات المتجهات (Vector Embeddings)
- البحث الدلالي (Semantic Search)
- البحث بالكلمات المفتاحية BM25 (BM25 Keyword Search)
- البحث الهجين (TF-IDF + الدلالي) (Hybrid Search)
- دمج الرتب المتبادلة (Reciprocal Rank Fusion)
- المشفرات المتقاطعة (Cross-encoders)
- ColBERT
- استراتيجيات التقطيع (Chunking Strategies)
- تحليل الاستعلام (Query Parsing)
- إعادة الترتيب (Reranking)
- هندسة الأوامر (Prompt Engineering)
- التكميم (Quantization)

مجالات التطبيق العملي

تستخدم الدورة مجموعات بيانات حقيقية من المجالات التالية:

  • 📰 الإعلام: مجموعات بيانات إخبارية
  • 🏥 الرعاية الصحية: وثائق طبية
  • 🛍️ التجارة الإلكترونية: بيانات المنتجات، معلومات التسعير
  • 📊 المالية: وثائق مالية

مخرجات التعلم

بعد إكمال الدورة، ستكون قادرًا على:

✅ تصميم وتنفيذ الأجزاء الكاملة لنظام RAG
✅ اختيار البنية الصحيحة لحالة الاستخدام
✅ استخدام قواعد بيانات المتجهات مثل Weaviate
✅ تجربة استراتيجيات الأوامر والاسترجاع
✅ مراقبة الأداء باستخدام أدوات مثل Phoenix
✅ فهم المفاضلات الرئيسية:

  • متى تستخدم الاسترجاع الهجين
  • كيفية إدارة قيود نافذة السياق
  • كيفية الموازنة بين زمن الاستجابة والتكلفة

✅ تقييم وتحسين مسار RAG بشكل متكرر
✅ التكيف مع الأساليب الجديدة وتطور النظام البيئي
✅ الانتقال من إثبات المفهوم إلى النشر الفعلي

المتطلبات المسبقة

  • ضروري: مهارات بايثون متوسطة
  • موصى به: معرفة أساسية بالذكاء الاصطناعي التوليدي
  • موصى به: مستوى رياضيات المرحلة الثانوية

مميزات الدورة

🎯 موجهة نحو الممارسة

  • 5 تجارب برمجة تدريجية
  • من النماذج الأولية البسيطة إلى مكونات على مستوى الإنتاج
  • مجموعات بيانات من العالم الحقيقي

📚 تعلم منهجي

  • تغطي التقنيات على مستوى المكونات والنظام
  • فهم المبادئ الأساسية والمفاضلات العملية
  • التكيف مع نظام RAG البيئي سريع التطور

🏆 الحصول على شهادة

بعد إكمال الدورة، ستحصل على شهادة من DeepLearning.AI، تثبت مهاراتك في بناء وتقييم أنظمة RAG باستخدام أدوات وتقنيات عملية.

أهمية RAG

لماذا نحتاج إلى RAG؟

نماذج اللغة الكبيرة، على الرغم من قوتها، غالبًا ما ترتكب أخطاء عندما لا تتوفر لديها المعلومات الصحيحة. يحل RAG هذه المشكلة بالطرق التالية:

  1. ترسيخ الاستجابات: بناء استجابات النموذج على بيانات ذات صلة، غالبًا ما تكون خاصة أو حديثة
  2. الوصول إلى المعرفة الخارجية: استرجاع المعلومات ذات الصلة التي لم يتم تضمينها عند تدريب LLM
  3. تحسين الدقة: استخدام قاعدة معرفية خاصة بالمجال، أو خاصة، أو حديثة

سيناريوهات تطبيق RAG

  • 🔧 الأدوات الداخلية: استعلامات قواعد المعرفة للشركات
  • 💬 مساعدو خدمة العملاء: الدعم بناءً على وثائق المنتج
  • 🎯 التطبيقات المتخصصة: أنظمة متخصصة في مجالات مثل الرعاية الصحية، القانون، المالية
  • 📱 المساعدون الشخصيون: خدمات مخصصة بناءً على بيانات المستخدم

نصائح للتعلم

وفقًا لتوصيات DeepLearning.AI:

  1. إنشاء مساحة دراسة مخصصة: إنشاء مساحة عمل هادئة، منظمة، وخالية من المشتتات
  2. وضع خطة دراسية متسقة: تحديد أوقات دراسة ثابتة، وتكوين عادة
  3. أخذ فترات راحة منتظمة: استخدام تقنية بومودورو (25 دقيقة دراسة + 5 دقائق راحة)
  4. المشاركة في المجتمع: الانضمام إلى المنتديات، مجموعات النقاش، والأنشطة المجتمعية
  5. التعلم النشط: تدوين الملاحظات، التلخيص، تعليم الآخرين، أو التطبيق في مشاريع عملية

الوصول إلى الدورة

دورات ذات صلة موصى بها

إذا كنت مهتمًا بـ RAG، يمكنك أيضًا دراسة:

  • بناء وتقييم تطبيقات RAG المتقدمة (Building and Evaluating Advanced RAG Applications)
  • رسوم المعرفة لـ RAG (Knowledge Graphs for RAG)
  • LangChain: الدردشة مع بياناتك (LangChain: Chat with Your Data)
  • بناء البحث متعدد الوسائط و RAG (Building Multimodal Search and RAG)
  • بناء RAG الوكيل باستخدام LlamaIndex (Building Agentic RAG with LlamaIndex)

ملخص

هذه دورة RAG شاملة ومتعمقة، مناسبة لمن يرغبون في:

  • الانتقال من إثبات المفهوم إلى بيئة الإنتاج من المهندسين
  • بناء تطبيقات LLM موثوقة وقابلة للتوسع من المطورين
  • فهم مفاضلات تصميم نظام RAG من ممارسي الذكاء الاصطناعي
  • إتقان أحدث تقنيات وأدوات RAG من المتعلمين

لا تقتصر الدورة على تعليم التنفيذ التقني فحسب، بل تركز أيضًا على تنمية التفكير المنهجي ومهارات اتخاذ القرارات الهندسية، مما يساعد المتعلمين على الحفاظ على قدرتهم التنافسية في نظام RAG البيئي المتطور باستمرار.