مشروع Ultralytics YOLO: نظرة عامة مفصلة
نظرة عامة على المشروع
Ultralytics YOLO هو إطار عمل متقدم للرؤية الحاسوبية يركز على توفير أحدث التقنيات في اكتشاف الكائنات، وتقسيم المثيلات، وتقدير الوضعية، والتتبع، والتصنيف، وغيرها. هذا المشروع عبارة عن مجموعة من نماذج YOLO المتطورة المبنية على سنوات من البحث الأساسي في الرؤية الحاسوبية والذكاء الاصطناعي.
عنوان المشروع: https://github.com/ultralytics/ultralytics
الميزات الأساسية
🎯 دعم المهام المتعددة
- اكتشاف الكائنات: تحديد وتحديد مواقع الكائنات في الصور أو مقاطع الفيديو.
- تقسيم المثيلات: تقسيم الصور أو مقاطع الفيديو إلى مناطق تتوافق مع كائنات أو فئات مختلفة.
- تقدير الوضعية: اكتشاف وتحليل وضعية ونقاط رئيسية لجسم الإنسان أو الكائنات.
- تصنيف الصور: تصنيف الصور بأكملها.
- تتبع الكائنات: تتبع أهداف متعددة في تسلسل الفيديو.
- اكتشاف الصناديق المحيطة الموجهة (OBB): دعم اكتشاف الأهداف الدوارة.
🚀 أحدث إصدارات النماذج
YOLO11
YOLO11 هو أحدث نموذج YOLO من Ultralytics، ويوفر أداءً متطورًا في مهام متعددة، بما في ذلك اكتشاف الكائنات، والتقسيم، وتقدير الوضعية، والتتبع، والتصنيف، مع قدرات محسنة لاستخراج الميزات.
التحسينات الرئيسية:
- استخراج الميزات المحسّن: شبكة العمود الفقري وهيكل الرقبة المحسّنان.
- تحسين الدقة والكفاءة: تحسين سرعة المعالجة مع الحفاظ على دقة عالية.
- اكتشاف أكثر دقة للكائنات: تحقيق أداء أفضل في الكشف من خلال بنية محسنة.
YOLO12
تتبنى YOLO12 طريقة اكتشاف الكائنات التي تركز على آلية الانتباه، وتتفوق في العديد من مهام الرؤية الحاسوبية الأساسية.
🔧 المزايا التقنية
- أداء في الوقت الفعلي: النماذج سريعة ودقيقة وسهلة الاستخدام، وتضمن البنية المحسنة أداءً عالي السرعة دون التضحية بالدقة.
- تحديثات مستمرة: تحديثات مستمرة لتحسين الأداء والمرونة.
- سهولة التكامل: واجهة برمجة تطبيقات Python بسيطة ودعم وثائق شامل.
- النشر عبر الأنظمة الأساسية: دعم النشر على مجموعة متنوعة من الأجهزة مثل NVIDIA Jetson و NVIDIA GPU وأنظمة macOS.
الوحدات الوظيفية الرئيسية
وضع التدريب (Training)
- دعم تدريب مجموعات البيانات المخصصة.
- تكامل أدوات تتبع متعددة (مثل Comet و Weights & Biases وما إلى ذلك).
- تحسين المعلمات الفائقة وإدارة التجارب.
- مراقبة المقاييس في الوقت الفعلي.
وضع الاستدلال (Inference)
- معالجة الدفعات والاستدلال على صورة واحدة.
- معالجة في الوقت الفعلي لتدفقات الفيديو.
- دعم خلفيات استدلال متعددة.
وضع التحقق (Validation)
- تقييم أداء النموذج.
- حساب المقاييس وتصورها.
- أدوات قياس الأداء.
وضع التصدير (Export)
- دعم التصدير بتنسيقات متعددة (ONNX و TensorRT و CoreML وما إلى ذلك).
- تحسين للأجهزة المحمولة والمضمنة.
سيناريوهات التطبيق
التطبيقات الصناعية
- الأمن الذكي: المراقبة في الوقت الفعلي واكتشاف الحالات الشاذة.
- القيادة الذاتية: التعرف على أهداف الطريق وتتبعها.
- فحص الجودة الصناعية: الكشف عن عيوب المنتج وتصنيفها.
- التصوير الطبي: تحليل الصور الطبية والمساعدة في التشخيص.
- تجارة التجزئة: تحليل حركة العملاء والتعرف على المنتجات.
- التحليل الرياضي: تحليل حركات الرياضيين وإحصائيات المباريات.
التكامل التقني
- رؤية الروبوت: الإدراك البيئي والملاحة.
- الواقع المعزز: التعرف على الأهداف وتتبعها في الوقت الفعلي.
- المنزل الذكي: اكتشاف الأشخاص والتعرف على السلوك.
البنية التقنية
ميزات بنية النموذج
- شبكة العمود الفقري المحسنة: تحسين قدرات استخراج الميزات.
- هيكل الرقبة المحسن: تعزيز دمج الميزات متعددة المقاييس.
- رأس الكشف الفعال: موازنة السرعة والدقة.
التقنيات الأساسية
- آلية الانتباه: تصميم مركز الانتباه المقدم في YOLO12.
- شبكة هرم الميزات: معالجة الميزات متعددة المقاييس.
- تحسين مربع الارتكاز: إنشاء مربع ارتكاز تكيفي وتحسينه.
التثبيت والاستخدام
بداية سريعة
# التثبيت
pip install ultralytics
# استخدام Python API
from ultralytics import YOLO
# تحميل النموذج
model = YOLO('yolo11n.pt')
# التدريب
model.train(data='coco8.yaml', epochs=100, imgsz=640)
# الاستدلال
results = model('path/to/image.jpg')
# التصدير
model.export(format='onnx')
استخدام سطر الأوامر
# التدريب
yolo train data=coco8.yaml model=yolo11n.pt epochs=100 imgsz=640
# الاستدلال
yolo predict model=yolo11n.pt source='path/to/image.jpg'
# التحقق
yolo val model=yolo11n.pt data=coco8.yaml
# التصدير
yolo export model=yolo11n.pt format=onnx
خصائص الأداء
ميزة السرعة
- قدرة المعالجة في الوقت الفعلي، ودعم الفيديو عالي الإطارات.
- محرك استدلال محسن.
- دعم المعالجة المتوازية متعددة وحدات معالجة الرسومات.
أداء الدقة
- تحقيق أحدث مقاييس mAP على مجموعة بيانات COCO.
- موازنة المفاضلة بين السرعة والدقة.
- دعم أحجام نماذج متعددة (nano، small، medium، large، extra-large).
كفاءة الموارد
- تحسين استخدام الذاكرة.
- استخدام فعال لموارد الحوسبة.
- دعم تقنيات ضغط النموذج مثل التكميم والتقليم.
ملخص
Ultralytics YOLO هو أحد حلول الرؤية الحاسوبية الأكثر تقدمًا واكتمالًا المتاحة حاليًا. لا يوفر أداءً قويًا للنموذج فحسب، بل يتميز أيضًا بسلسلة أدوات ونظام بيئي كاملين. سواء كان بحثًا أكاديميًا أو تطبيقًا صناعيًا أو مشروعًا شخصيًا، يمكنك العثور على الحل المناسب في هذا الإطار. تضمن التحديثات والتحسينات المستمرة حصول المستخدمين دائمًا على أحدث التطورات التقنية وأفضل تجربة استخدام.
