tloen/alpaca-loraPlease refer to the latest official releases for information GitHub Homepage

استخدم تقنية LoRA للتكيف منخفض الرتب لضبط نماذج LLaMA بدقة على أجهزة استهلاكية، وبناء مساعد ذكاء اصطناعي سريع يتبع التعليمات يشبه ChatGPT.

Apache-2.0Jupyter Notebook 18.9ktloen Last Updated: 2024-07-29

نظرة عامة على مشروع Alpaca-LoRA

Alpaca-LoRA هو مشروع مفتوح المصدر، تم تطويره بواسطة tloen، ويهدف إلى إعادة إنتاج تأثير نموذج Alpaca الخاص بجامعة ستانفورد باستخدام تقنية التكيف منخفض الرتبة (LoRA) على أجهزة استهلاكية. يوفر المشروع نموذجًا لاتباع التعليمات بجودة مماثلة لـ text-davinci-003، ويمكن تشغيله حتى على Raspberry Pi (لأغراض البحث)، ويمكن توسيع الكود بسهولة ليشمل نماذج 13B و 30B و 65B.

التقنيات الأساسية

تقنية LoRA (التكيف منخفض الرتبة)

التعريف: LoRA هي طريقة ضبط دقيق فعالة للمعلمات، تحقق تكييف النموذج عن طريق إضافة عدد قليل من المعلمات القابلة للتدريب إلى النموذج المدرب مسبقًا.
المزايا: يقلل بشكل كبير من موارد الحوسبة ومساحة التخزين المطلوبة للتدريب.
التطبيق: يمكّن المستخدمين العاديين من ضبط النماذج اللغوية الكبيرة بدقة على وحدة معالجة رسومات استهلاكية واحدة.

البنية التحتية

النموذج الأساسي: LLaMA (Large Language Model Meta AI) من Meta.
بيانات الضبط الدقيق: استنادًا إلى مجموعة بيانات تعليمات 52K الخاصة بـ Stanford Alpaca.
المكدس التقني:
- Hugging Face PEFT (Parameter-Efficient Fine-Tuning)
- مكتبة bitsandbytes الخاصة بـ Tim Dettmers
- إطار عمل التعلم العميق PyTorch

الميزات الرئيسية

1. سهولة الاستخدام على الأجهزة

الحد الأدنى من المتطلبات: وحدة معالجة رسومات RTX 4090 واحدة.
وقت التدريب: يكتمل التدريب في غضون ساعات قليلة.
دعم الاستدلال: يدعم الاستدلال الكمي 8 بت، مما يقلل من متطلبات الأجهزة بشكل أكبر.

2. دعم أحجام نماذج متعددة

نموذج 7B: مناسب للبحث والدراسة الشخصية.
نموذج 13B: أداء أفضل.
نماذج 30B و 65B: تطبيقات احترافية.

3. سهولة الاستخدام

تثبيت بسيط: تثبيت التبعيات عبر pip.
بداية سريعة: توفير نصوص تدريب واستدلال كاملة.
دعم Docker: نشر حاويات، مما يقلل من صعوبة تكوين البيئة.

التثبيت والاستخدام

إعداد البيئة

# استنساخ المشروع
git clone https://github.com/tloen/alpaca-lora.git
cd alpaca-lora

# تثبيت التبعيات
pip install -r requirements.txt

تدريب النموذج

# أمر التدريب الأساسي
python finetune.py \
    --base_model 'decapoda-research/llama-7b-hf' \
    --data_path 'yahma/alpaca-cleaned' \
    --output_dir './lora-alpaca'

# تدريب المعلمات الفائقة المخصصة
python finetune.py \
    --base_model 'decapoda-research/llama-7b-hf' \
    --data_path 'yahma/alpaca-cleaned' \
    --output_dir './lora-alpaca' \
    --batch_size 128 \
    --micro_batch_size 4 \
    --num_epochs 3 \
    --learning_rate 1e-4 \
    --cutoff_len 512 \
    --val_set_size 2000 \
    --lora_r 8 \
    --lora_alpha 16 \
    --lora_dropout 0.05 \
    --lora_target_modules '[q_proj,v_proj]' \
    --train_on_inputs \
    --group_by_length

استدلال النموذج

# بدء خدمة الاستدلال
python generate.py \
    --load_8bit \
    --base_model 'decapoda-research/llama-7b-hf' \
    --lora_weights 'tloen/alpaca-lora-7b'

نشر Docker

# بناء الصورة
docker build -t alpaca-lora .

# تشغيل الحاوية
docker run --gpus=all --shm-size 64g -p 7860:7860 \
    -v ${HOME}/.cache:/root/.cache --rm alpaca-lora generate.py \
    --load_8bit \
    --base_model 'decapoda-research/llama-7b-hf' \
    --lora_weights 'tloen/alpaca-lora-7b'

أداء

مقارنة مع النماذج القياسية

يقدم المشروع نتائج مقارنة مفصلة مع Stanford Alpaca و text-davinci-003:

مثال على التعليمات: أخبرني عن الألبكة

Alpaca-LoRA: يقدم معلومات دقيقة ومفصلة حول الألبكة، بما في ذلك الخصائص البيولوجية والاستخدامات.
Stanford Alpaca: استجابة عالية الجودة مماثلة.
text-davinci-003: استجابة نموذج OpenAI كمعيار.

اختبار المهام التقنية:

مهام البرمجة (مثل سلسلة فيبوناتشي، FizzBuzz)
الترجمة اللغوية
أسئلة وأجوبة واقعية
الاستدلال المنطقي

تحليل المزايا

فعالية التكلفة: انخفاض التكلفة بنسبة تزيد عن 99٪ مقارنة بتدريب نموذج كامل.
كفاءة الوقت: يكتمل التدريب في غضون ساعات قليلة، بدلاً من أسابيع.
ضمان الجودة: جودة الإخراج قريبة من النماذج التجارية الكبيرة.
قابلية التوسع: يدعم التكيف مع لغات ومجالات متخصصة متعددة.

النظام البيئي والتوسع

الدعم الرسمي

Hugging Face Hub: استضافة الأوزان المدربة مسبقًا.
تجربة عبر الإنترنت: توفير نسخة تجريبية عبر الإنترنت من خلال Hugging Face Spaces.
دعم المجتمع: مجتمع Discord نشط.

توسعات الطرف الثالث

دعم متعدد اللغات:

النسخة الصينية (Chinese-Alpaca-LoRA)
النسخة اليابانية (Japanese-Alpaca-LoRA)
الألمانية والفرنسية والإسبانية والعديد من اللغات الأخرى

التكيف مع المجالات المتخصصة:

نسخة مدربة على مجموعة بيانات GPT-4
إصدارات متخصصة في الطب والقانون وغيرها من المجالات
توسيع متعدد الوسائط (نص + صورة)

أدوات النشر:

alpaca.cpp: نسخة محسنة للاستدلال على وحدة المعالجة المركزية
Alpaca-LoRA-Serve: واجهة ويب بنمط ChatGPT
إصدارات متوافقة مع الأجهزة المحمولة

سلسلة الأدوات المتوافقة

llama.cpp: محرك استدلال فعال لوحدة المعالجة المركزية.
alpaca.cpp: محرك استدلال Alpaca مُحسَّن خصيصًا.
تنسيق ONNX: دعم النشر عبر الأنظمة الأساسية.

مجموعة البيانات والتدريب

بيانات التدريب

مجموعة بيانات Stanford Alpaca: 52 ألف زوج من التعليمات والاستجابات.
جودة البيانات: بيانات تعليمات عالية الجودة تم إنشاؤها بواسطة GPT-3.5.
تنسيق البيانات: تنسيق الضبط الدقيق للتعليمات القياسي.
الترخيص: ترخيص إسناد ODC.

مشاريع تحسين البيانات

AlpacaDataCleaned: مشروع تحسين جودة البيانات.
GPT-4 Alpaca Data: بيانات عالية الجودة تم إنشاؤها باستخدام GPT-4.
Dolly 15k: مجموعة بيانات تعليمات تم إنشاؤها يدويًا.

شرح مفصل للهيكل التقني

المكونات الأساسية

finetune.py: نص الضبط الدقيق الرئيسي، الذي يتضمن تنفيذ LoRA وبناء المطالبات.
generate.py: نص الاستدلال، الذي يدعم واجهة ويب Gradio.
export_*.py: نصوص تصدير النموذج، التي تدعم تنسيقات متعددة.

المعلمات الرئيسية

lora_r: رتبة LoRA، تتحكم في حجم المحول.
lora_alpha: معلمة القياس، تؤثر على مدى تأثير المحول.
lora_dropout: معدل التسرب لمنع الإفراط في التجهيز.
lora_target_modules: الوحدات التي تحتاج إلى إضافة طبقات LoRA إليها.

سيناريوهات التطبيق

أغراض البحث

البحث الأكاديمي: معالجة اللغة الطبيعية، أبحاث التعلم الآلي.
التعليم والتدريس: ممارسة دورة الذكاء الاصطناعي، عرض توضيحي لتدريب النموذج.
تطوير النموذج الأولي: التحقق السريع من أفكار تطبيق الذكاء الاصطناعي.

التطبيقات التجارية

روبوتات خدمة العملاء: الضبط الدقيق بناءً على بيانات مجال معين.
إنشاء المحتوى: نسخة تسويقية، إنشاء وثائق فنية.
مساعد الكود: تطوير أدوات مساعدة البرمجة.

المشاريع الشخصية

مساعد شخصي: مساعد ذكاء اصطناعي مخصص بناءً على التفضيلات الشخصية.
أداة التعلم: تعلم اللغة، نظام أسئلة وأجوبة المعرفة.
الكتابة الإبداعية: تأليف القصص، إنشاء الشعر.

القيود والاحتياطات

القيود التقنية

الاعتماد على النموذج الأساسي: الحد الأعلى للأداء يقتصر على النموذج الأساسي LLaMA.
الاعتماد على جودة البيانات: تعتمد جودة الإخراج بشدة على جودة بيانات التدريب.
موارد الحوسبة: لا يزال التدريب يتطلب موارد وحدة معالجة رسومات كبيرة.

احتياطات الاستخدام

قضايا حقوق النشر: يجب الانتباه إلى ترخيص استخدام نموذج LLaMA.
أمن البيانات: قد تحتوي بيانات التدريب على معلومات حساسة.
تحيز النموذج: قد يرث تحيزات النموذج الأساسي وبيانات التدريب.

اتجاهات التنمية المستقبلية

التحسينات التقنية

طرق تكييف أكثر كفاءة: استكشاف تقنيات الضبط الدقيق الأكثر كفاءة من LoRA.
دعم متعدد الوسائط: التوسع ليشمل بيانات متعددة الوسائط مثل الصور والصوت.
التعلم عبر الإنترنت: دعم التعلم المستمر والتكيف في الوقت الفعلي.

بناء النظام البيئي

التوحيد القياسي: إنشاء معايير موحدة للضبط الدقيق والنشر.
تحسين سلسلة الأدوات: توفير أدوات تطوير ونشر أكثر اكتمالاً.
مساهمات المجتمع: تشجيع المزيد من المطورين على المساهمة بالكود والبيانات.

خاتمة

يمثل مشروع Alpaca-LoRA خطوة مهمة في إضفاء الطابع الديمقراطي على الذكاء الاصطناعي، مما يجعل الضبط الدقيق للنماذج اللغوية الكبيرة عالية الجودة في متناول الجميع. من خلال تقنية LoRA، نجح المشروع في جلب قدرات الذكاء الاصطناعي على مستوى المؤسسات إلى المطورين والباحثين الأفراد.