المرحلة الخامسة: استكشاف سيناريوهات تطبيق الذكاء الاصطناعي
دورة الصوت الرسمية من Hugging Face، تعلم كيفية استخدام Transformers لمعالجة البيانات الصوتية، وتغطي مسارًا تعليميًا كاملاً لمهام مثل التعرف على الكلام وتصنيف الصوت وتحويل النص إلى كلام.
مقدمة تفصيلية لدورة Hugging Face الصوتية
نظرة عامة على الدورة
دورة Hugging Face الصوتية هي دورة شاملة تركز على استخدام نماذج Transformers لمعالجة البيانات الصوتية. توضح هذه الدورة كيف تحقق نماذج Transformers، باعتبارها واحدة من أقوى وأكثر بنى التعلم العميق تنوعًا، أحدث النتائج في مجال معالجة الصوت.
أهداف الدورة
ستعلم هذه الدورة المتعلمين كيفية تطبيق نماذج Transformers على البيانات الصوتية، وتغطي مجموعة متنوعة من المهام المتعلقة بالصوت:
- التعرف على الكلام (Speech Recognition)
- تصنيف الصوت (Audio Classification)
- تحويل النص إلى كلام (Text-to-Speech Generation)
- تحويل الكلام في الوقت الفعلي (Real-time Speech Transcription)
مميزات الدورة
🎯 عملية للغاية
- توفر وظيفة العرض التوضيحي في الوقت الفعلي، حيث يمكن للمتعلمين تجربة قدرة النموذج على تحويل الكلام مباشرة.
- تتضمن عددًا كبيرًا من التمارين والمشاريع العملية.
- تعتمد على نماذج قوية مدربة مسبقًا للتطوير.
📚 تعلم منهجي
- فهم عميق لخصوصية معالجة البيانات الصوتية.
- تعلم بنى Transformer المختلفة.
- تدريب نماذج Transformers الصوتية الخاصة بك.
🆓 مجانية بالكامل
- مجانية 100% ومتاحة للجميع ومفتوحة المصدر.
- جميع المواد التعليمية يمكن الوصول إليها بحرية.
فريق الدورة
سانشيت غاندي
- مهندس أبحاث تعلم الآلة في Hugging Face
- يركز على التعرف التلقائي على الكلام والترجمة.
- ملتزم بجعل نماذج الكلام أسرع وأخف وزنًا وأسهل في الاستخدام.
ماتياس هوليمانس
- مهندس تعلم الآلة في Hugging Face
- مؤلف كتب متعلقة بمركبات الصوت (Audio Synthesizers).
- مطور إضافات صوتية.
ماريا خالوسوفا
- رئيسة الوثائق والدورات التدريبية في Hugging Face
- متخصصة في إنشاء المحتوى التعليمي والوثائق.
- بارعة في تبسيط المفاهيم التقنية المعقدة.
فايبهاف سريفاستاف
- مهندس دعم المطورين في تعلم الآلة في Hugging Face
- يبحث في تقنيات تحويل النص إلى كلام للموارد المنخفضة.
- ملتزم بنشر أحدث أبحاث الكلام.
هيكل الدورة
الوحدة 1: أساسيات البيانات الصوتية
- تعلم خصوصية معالجة البيانات الصوتية.
- تقنيات معالجة الصوت وإعداد البيانات.
الوحدة 2: مقدمة لتطبيقات الصوت
- فهم سيناريوهات تطبيقات الصوت.
- تعلم استخدام مسارات 🤗 Transformers (pipelines).
- ممارسة مهام تصنيف الصوت والتعرف على الكلام.
الوحدة 3: استكشاف بنى Transformer
- فهم عميق لبنى Transformer الصوتية.
- تعلم الفروق بين البنى المختلفة وسيناريوهات تطبيقها.
الوحدة 4: مصنف أنواع الموسيقى
- بناء مصنف أنواع الموسيقى الخاص بك.
- ممارسة تطوير المشاريع.
الوحدة 5: التعلم العميق للتعرف على الكلام
- دراسة متعمقة لتقنيات التعرف على الكلام.
- بناء نموذج لتحويل تسجيلات الاجتماعات.
الوحدة 6: تحويل النص إلى كلام
- تعلم تقنيات توليد الكلام من النص.
- تطبيق نظام تحويل النص إلى كلام (TTS).
الوحدة 7: تطوير التطبيقات العملية
- تعلم بناء تطبيقات صوتية واقعية.
- تطوير حلول كاملة باستخدام نماذج Transformers.
مسار التعلم والشهادات
مرونة الدورة
- يمكن التعلم بالسرعة التي تناسبك.
- يُنصح بالتعلم بترتيب الوحدات.
- توفر اختبارات لتقييم نتائج التعلم.
خيارات الشهادات
شهادة إتمام (Certificate of completion)
- المتطلبات: إكمال 80% من التمارين العملية.
شهادة شرف (Certificate of honors)
- المتطلبات: إكمال 100% من التمارين العملية.
المتطلبات المسبقة
الخلفية المطلوبة
- معرفة أساسية بالتعلم العميق.
- فهم أساسي لنماذج Transformers.
الخلفية غير المطلوبة
- لا تتطلب معرفة متخصصة في معالجة البيانات الصوتية.
- إذا كنت بحاجة إلى استكمال معرفتك بنماذج Transformers، يمكنك الرجوع إلى دورة معالجة اللغة الطبيعية (NLP Course).
جدول الإصدار
الوحدة | تاريخ الإصدار |
---|---|
الوحدة 0، الوحدة 1، الوحدة 2 | 14 يونيو 2023 |
الوحدة 3، الوحدة 4 | 21 يونيو 2023 |
الوحدة 5 | 28 يونيو 2023 |
الوحدة 6 | 5 يوليو 2023 |
الوحدة 7، الوحدة 8 | 12 يوليو 2023 |
المكدس التقني
الأدوات الرئيسية
- مكتبة 🤗 Transformers
- مجموعات البيانات 🤗 Datasets
- أدوات الترميز 🤗 Tokenizers
- 🤗 Accelerate
- مركز Hugging Face Hub
التقنيات المغطاة
- استخدام النماذج المدربة مسبقًا.
- المعالجة المسبقة للبيانات الصوتية.
- الضبط الدقيق للنماذج وتدريبها.
- معالجة الصوت في الوقت الفعلي.
- استخراج ميزات الصوت.
مخرجات التعلم
بعد إكمال هذه الدورة، سيكتسب المتعلمون ما يلي:
- أساس نظري متين: فهم عميق لمبادئ تطبيق نماذج Transformers في مجال الصوت.
- مهارات عملية: القدرة على التعامل مع مهام متنوعة متعلقة بالصوت.
- خبرة في المشاريع: إكمال العديد من المشاريع العملية، بما في ذلك المصنفات وأنظمة التعرف وغيرها.
- قدرات هندسية: القدرة على بناء ونشر تطبيقات معالجة الصوت.
المساهمة مفتوحة المصدر
هذه الدورة مفتوحة المصدر بالكامل، ومستضافة على GitHub، ونرحب بمساهمات المجتمع والترجمات. يمكن العثور على مواد الدورة في مستودع GitHub.
الجمهور المستهدف
- ممارسو التعلم العميق المهتمون بمعالجة الصوت.
- الباحثون الذين يرغبون في تطبيق نماذج Transformers في مجال الصوت.
- المطورون الذين يحتاجون إلى بناء تطبيقات متعلقة بالصوت.
- المتعلمون المهتمون بتقنيات مثل التعرف على الكلام وتصنيف الصوت.