Home
Login
PaddlePaddle/PaddleOCR

يهدف PaddleOCR إلى إنشاء مجموعة أدوات OCR غنية ورائدة وسهلة الاستخدام، لمساعدة المطورين على تدريب نماذج OCR أفضل وأسرع وأكثر دقة.

Apache-2.0Python 50.4kPaddlePaddle Last Updated: 2025-06-14
https://github.com/PaddlePaddle/PaddleOCR

مقدمة عن مشروع PaddleOCR

نظرة عامة على المشروع

PaddleOCR هي مجموعة أدوات مفتوحة المصدر للتعرف الضوئي على الحروف (OCR) تعتمد على إطار التعلم العميق PaddlePaddle. تهدف إلى توفير مجموعة شاملة وسهلة الاستخدام وعالية الأداء لحلول OCR، تغطي اكتشاف النصوص، والتعرف على النصوص، وأنظمة OCR الشاملة، بالإضافة إلى الأدوات والنماذج ذات الصلة. يدعم PaddleOCR لغات متعددة ويوفر نماذج مُدرَّبة مسبقًا غنية لتسهيل النشر والتطبيق السريع للمستخدمين.

خلفية المشروع

مع تسارع التحول الرقمي، يتزايد تطبيق تقنية OCR في مختلف الصناعات. ومع ذلك، غالبًا ما تعاني أنظمة OCR التقليدية من مشاكل مثل الدقة المنخفضة، والتعقيد في النشر، وضعف القدرة على التكيف مع سيناريوهات محددة. يهدف ظهور PaddleOCR إلى حل هذه المشكلات، وذلك باستخدام تقنيات التعلم العميق لتوفير حلول OCR أكثر دقة ومرونة وسهولة في الاستخدام.

تتضمن الخلفية الرئيسية لتطوير PaddleOCR الجوانب التالية:

  • الطلب المتزايد على OCR: مع النمو الهائل في البيانات غير المهيكلة مثل المستندات الإلكترونية والصور، يتزايد أيضًا الطلب على تقنية OCR.
  • التقدم في تقنيات التعلم العميق: حقق التعلم العميق تقدمًا كبيرًا في مجال التعرف على الصور، مما يوفر أفكارًا وطرقًا جديدة لتحسين تقنية OCR.
  • نضج إطار PaddlePaddle: يوفر PaddlePaddle، باعتباره إطار تعلم عميق تم تطويره بشكل مستقل بواسطة Baidu، قدرات حسابية قوية وواجهات تطوير مرنة، مما يوفر أساسًا متينًا لتطوير PaddleOCR.

الخصائص الأساسية

يتميز PaddleOCR بالخصائص الأساسية التالية:

  • الشمولية: يوفر حلولاً كاملة من اكتشاف النصوص والتعرف على النصوص إلى أنظمة OCR الشاملة.
  • الأداء العالي: استنادًا إلى إطار PaddlePaddle، يستفيد بشكل كامل من تسريع GPU لتحقيق استدلال OCR فعال.
  • سهولة الاستخدام: يوفر واجهات برمجة تطبيقات (APIs) موجزة ووثائق غنية لتسهيل البدء السريع والنشر للمستخدمين.
  • دعم لغات متعددة: يدعم التعرف على OCR بلغات متعددة، بما في ذلك الصينية والإنجليزية واليابانية والكورية وغيرها.
  • نماذج مُدرَّبة مسبقًا غنية: يوفر عددًا كبيرًا من النماذج المُدرَّبة مسبقًا، تغطي سيناريوهات ولغات مختلفة، لتسهيل الاستخدام المباشر أو الضبط الدقيق للمستخدمين.
  • قابلية التخصيص: يدعم المستخدمين لتخصيص هياكل النماذج وبيانات التدريب ومقاييس التقييم لتلبية احتياجات سيناريوهات محددة.
  • نظام شامل: يوفر نظام OCR شاملاً يعتمد على خوارزميات متقدمة مثل DBNet و CRNN و Transformer، دون الحاجة إلى تجميع وحدات اكتشاف النصوص والتعرف عليها يدويًا.
  • دعم الأجهزة المحمولة: يوفر تحسينات للأجهزة المحمولة، مما يتيح استدلال OCR فعال على الأجهزة المحمولة.
  • ضغط النموذج: يدعم تقنيات ضغط النموذج لتقليل حجم النموذج وزيادة سرعة الاستدلال.

سيناريوهات التطبيق

يمكن تطبيق PaddleOCR في مجموعة متنوعة من السيناريوهات التي تتطلب التعرف على النصوص، بما في ذلك على سبيل المثال لا الحصر:

  • التعرف على المستندات: التعرف على المعلومات النصية في المستندات الممسوحة ضوئيًا ومستندات PDF، لتحقيق رقمنة المستندات.
  • التعرف على الفواتير: التعرف على المعلومات النصية على الفواتير وبطاقات الائتمان وبطاقات الهوية وغيرها من المستندات، لتحقيق الإدخال التلقائي.
  • التعرف على النصوص في الصور: التعرف على المعلومات النصية في الصور، مثل اللوحات الإعلانية ومشاهد الشوارع ولقطات الشاشة وما إلى ذلك.
  • التعرف على لوحات أرقام المركبات: التعرف على أرقام لوحات المركبات، لإدارة مواقف السيارات والمراقبة المرورية وما إلى ذلك.
  • الكشف الصناعي: التعرف على المعلومات النصية على المنتجات الصناعية، لفحص الجودة والتتبع.
  • أتمتة المكاتب: أتمتة معالجة المهام التي تتضمن معلومات نصية، مثل تصنيف البريد الإلكتروني واستخراج المعلومات وما إلى ذلك.
  • المجال التعليمي: مساعدة الطلاب في التعلم، مثل التعرف على النصوص في الكتب المدرسية وتصحيح الواجبات المنزلية وما إلى ذلك.
  • المجال المالي: أتمتة معالجة المستندات المالية والعقود وما إلى ذلك، لتحسين الكفاءة.

بفضل شموليته وأدائه العالي وسهولة استخدامه، يتمتع PaddleOCR بآفاق تطبيق واسعة في مختلف الصناعات.

جميع التفاصيل، يرجى الرجوع إلى الموقع الرسمي (https://github.com/PaddlePaddle/PaddleOCR)