المرحلة الرابعة: التعلم العميق والشبكات العصبية
دورة تدريبية عملية على البرمجة باستخدام نماذج لغوية كبيرة، تم تطويرها بواسطة جامعة شنغهاي جياو تونغ، وتغطي 11 موضوعًا أساسيًا بما في ذلك الضبط الدقيق والنشر والهندسة السريعة وتحرير النماذج وتقنيات الأمان، وهي مصدر تعليمي كامل.
مقدمة تفصيلية لدورة "التعلم العملي للنماذج اللغوية الكبيرة"
نظرة عامة على الدورة
"التعلم العملي للنماذج اللغوية الكبيرة" هي مجموعة من الدروس التعليمية العملية لبرمجة النماذج اللغوية الكبيرة، تم تطويرها بواسطة جامعة شنغهاي جياو تونغ، وتستند إلى دورة "تقنيات أمن الذكاء الاصطناعي" (NIS3353) لربيع 2024. تهدف هذه الدروس، التي يقودها الأستاذ تشانغ تشو شنغ، إلى تزويد المتعلمين بمرجع برمجي للمبتدئين يتعلق بالنماذج اللغوية الكبيرة، وهي مورد تعليمي مفتوح المصدر ذو طبيعة خيرية ومجاني بالكامل.
مميزات الدروس التعليمية
- موجهة نحو التطبيق العملي: تساعد المتعلمين على البدء بسرعة في النماذج اللغوية الكبيرة من خلال ممارسات بسيطة.
- مجانية بالكامل: ذات طبيعة خيرية، بدون أي رسوم.
- دمج الأكاديمية والصناعة: توسيع لمواد المحاضرات من جامعة رائدة.
- تحديثات مستمرة: تم إجراء تحديث كبير في يونيو 2025، مع إضافة مواضيع جديدة ومحتوى محلي.
المحتوى التعليمي الأساسي
هيكل الفصول الرئيسية
الفصل الأول: الضبط الدقيق والنشر
- التركيز على المحتوى: دليل الضبط الدقيق ونشر النماذج المدربة مسبقًا.
- أهداف التعلم: إتقان كيفية اختيار النماذج المدربة مسبقًا المناسبة، وإجراء الضبط الدقيق لها لمهام محددة، ونشر النماذج المضبوطة بدقة كعروض توضيحية قابلة للاستخدام.
- الموارد المتاحة:
- مواد الدورة (بصيغة PDF)
- وثائق تعليمية مفصلة
- نصوص برمجية عملية (Jupyter Notebook)
الفصل الثاني: هندسة الأوامر (Prompt Engineering)
- موارد التعلم:
- مواد الدورة
dive-into-prompting.pdf
- وثائق تعليمية README.md
- نص برمجي عملي
dive-prompting.ipynb
- مواد الدورة
الفصل الثالث: تعديل النموذج
- موارد التعلم:
- مواد الدورة
dive_edit_0410.pdf
- وثائق تعليمية كاملة
- نص برمجي عملي
dive_edit.ipynb
- مواد الدورة
الفصل الرابع: الاستدلال الرياضي
- موارد التعلم:
- مواد الدورة
math.pdf
- وثائق تعليمية
- نص برمجي عملي للاستدلال الرياضي
sft_math.ipynb
- مواد الدورة
الفصل الخامس: تقنية العلامة المائية
- موارد التعلم:
- مواد الدورة
watermark.pdf
- وثائق تعليمية
- نص برمجي عملي
watermark.ipynb
- مواد الدورة
الفصل السادس: هجمات كسر الحماية (Jailbreak)
- موارد التعلم:
- مواد الدورة
dive-Jailbreak.pdf
- وثائق تعليمية
- نص برمجي عملي
dive-jailbreak.ipynb
- مواد الدورة
الفصل السابع: إخفاء المعلومات (Steganography)
- موارد التعلم:
- مواد الدورة
stega.pdf
- وثائق تعليمية
- نص برمجي عملي
llm_stega.ipynb
- مواد الدورة
الفصل الثامن: النماذج اللغوية الكبيرة متعددة الوسائط
- موارد التعلم:
- مواد الدورة
mllms.pdf
- وثائق تعليمية
- نص برمجي عملي
mllms.ipynb
- مواد الدورة
الفصل التاسع: وكيل واجهة المستخدم الرسومية (GUI Agent)
- موارد التعلم:
- مواد الدورة
GUIagent.pdf
- وثائق تعليمية
- نص برمجي عملي
GUIagent.ipynb
- مواد الدورة
الفصل العاشر: أمن الذكاء الاصطناعي
- موارد التعلم:
- مواد الدورة
dive-into-safety.pdf
- وثائق تعليمية
- نص برمجي عملي
agent.ipynb
- مواد الدورة
الفصل الحادي عشر: محاذاة النماذج اللغوية الكبيرة (RLHF)
- موارد التعلم:
- مواد الدورة
RLHF.pdf
- وثائق تعليمية
- نص برمجي عملي
RLHF.ipynb
- مواد الدورة
نقاط بارزة خاصة
سلسلة "العملية الكاملة لتطوير النماذج اللغوية الكبيرة" المحلية
في تحديث يونيو 2025، أطلقت الدروس التعليمية، بالتعاون مع مجتمع هواوي أسيند (Huawei Ascend)، نسخة محلية:
- الدعم الفني: تم تطويرها بناءً على الأجهزة والبرمجيات الأساسية لـ Huawei Ascend.
- شكل الدروس التعليمية: تتضمن أشكالاً متعددة مثل عروض PowerPoint، وأدلة المختبرات، ومقاطع الفيديو.
- مستويات الصعوبة: مقسمة إلى سلاسل للمبتدئين والمتوسطين والمتقدمين.
- مسار التعلم: موجه لتلبية احتياجات الممارسة المختلفة للنماذج اللغوية الكبيرة.
- موجهة نحو التطبيق العملي: تقدم التقنيات المتطورة من خلال ممارسات برمجية.
هيكل موارد التعلم
يقدم كل فصل ثلاثة أنواع من الموارد الأساسية:
- مواد الدورة (PDF): شرح المعرفة النظرية والمفاهيم.
- وثائق تعليمية (README.md): إرشادات مفصلة خطوة بخطوة.
- نصوص برمجية عملية (Jupyter Notebook): أمثلة تعليمات برمجية قابلة للتشغيل.
الجمهور المستهدف
- المبتدئون الذين يرغبون في البدء بالنماذج اللغوية الكبيرة.
- الطلاب الذين يحتاجون إلى تصميم مشاريع دراسية.
- الباحثون المشاركون في البحث الأكاديمي.
- المطورون المهتمون بالممارسات العملية للنماذج اللغوية الكبيرة.
- المهنيون الذين يرغبون في فهم تقنيات أمن الذكاء الاصطناعي.
الخصائص التقنية
- عملية للغاية: كل فصل يحتوي على كود قابل للتنفيذ.
- منهجية جيدة: تتدرج من المفاهيم الأساسية إلى التطبيقات المتقدمة.
- متطورة للغاية: تغطي أحدث تقنيات النماذج اللغوية الكبيرة وقضايا الأمن.
- سهلة الفهم: مستمدة من دورات جامعية، مع نظام تعليمي متكامل.
الحصول والاستخدام
- مفتوح المصدر ومجاني: المشروع مفتوح المصدر بالكامل، ويمكن لأي شخص الوصول إليه مجانًا.
- تحديثات مستمرة: فريق المشروع يقوم بصيانة وتحديث المحتوى باستمرار.
- دعم المجتمع: نرحب بتقديم المشكلات (Issues) وطلبات السحب (Pull Requests).
- خلفية أكاديمية: تم تطويرها بناءً على دورات رسمية من جامعة شنغهاي جياو تونغ.
سجل التحديثات
- يونيو 2025: تحديث كبير، مع إضافة محتوى محلي ومواضيع جديدة.
- صيانة مستمرة: فريق المشروع يقوم بتحديث المحتوى وتحسينه بانتظام.
ملاحظة: جميع محتويات هذه الدروس التعليمية تستند إلى الخبرة الشخصية للمساهمين، وبيانات الإنترنت، وتراكم العمل البحثي، وهي مخصصة لأغراض المرجع والتعلم فقط.