المرحلة الثالثة: البيانات وهندسة الميزات

معسكر تدريبي مجاني في هندسة البيانات لمدة 6 أسابيع من إنتاج Data with Zach، يغطي نمذجة البيانات ومعالجة البيانات الضخمة ومعالجة التدفقات في الوقت الفعلي وممارسات هندسة البيانات على مستوى المؤسسات.

هندسة_البياناتApacheSparkالبيانات_الضخمةYouTubeVideoFreeEnglish

مقدمة دورة معسكر تدريب هندسة البيانات

نظرة عامة على الدورة

  • المحاضر: Data with Zach
  • المنصة: YouTube
  • طبيعة الدورة: معسكر تدريب مجاني في هندسة البيانات
  • إجمالي المشاهدات: أكثر من 2.34 مليون مشاهدة
  • عدد الفيديوهات: 21 فيديو

هيكل محتوى الدورة

الأسبوع الأول - أساسيات نمذجة البيانات

  1. فيديو إطلاق معسكر تدريب هندسة البيانات المجاني لمدة 6 أسابيع
  2. فيديو بدء معسكر تدريب هندسة البيانات لمدة 6 أسابيع ومعلومات
  3. نمذجة البيانات - أنواع البيانات المعقدة والتراكم - محاضرة اليوم الأول (43:17)
  4. نمذجة البيانات - الأبعاد التراكمية، الهياكل والمصفوفات - تطبيق عملي اليوم الأول (41:17)
  5. نمذجة البيانات - الأبعاد المتغيرة ببطء والثباتية - محاضرة اليوم الثاني (40:26)
  6. نمذجة البيانات - بناء الأبعاد المتغيرة ببطء (SCDs) - تطبيق عملي اليوم الثاني (45:39)
  7. نمذجة البيانات - قواعد بيانات الرسوم البيانية والأبعاد المضافة - محاضرة اليوم الثالث (34:08)
  8. نمذجة البيانات - بناء رسم بياني لشبكة لاعبي NBA - تطبيق عملي اليوم الثالث (42:15)

الأسبوع الثاني - معالجة البيانات الضخمة

  1. كيف تقوم ميتا بنمذجة بيانات الأحداث ذات الحجم الكبير - دورة كاملة 4 ساعات (3:51:54)
  2. سبارك + آيسبرغ في ساعة واحدة - ضبط الذاكرة، عمليات الربط، التقسيم - الأسبوع 3 اليوم 1 (1:15:02)

الأسبوع الثالث - معالجة البيانات عالية الأداء والاختبار

  1. سبارك عالي الأداء في ساعة واحدة - إطارات البيانات، مجموعات البيانات، وظائف المستخدم المعرفة، التخزين المؤقت - الأسبوع 3 اليوم 2 (1:10:17)
  2. اختبار مهام أباتشي سبارك في CI/CD - الأسبوع 3 اليوم 3 (1:08:59)
  3. بناء خط أنابيب ذهبي مثل عملية MIDAS من Airbnb - الأسبوع 3 اليوم 1 تحليلات (1:19:47)
  4. إتقان عقود البيانات في 25 دقيقة! - الأسبوع 3 اليوم 2 تحليلات (27:36)
  5. إتقان خطوط أنابيب البيانات في الوقت الفعلي باستخدام كافكا وفلينك - دورة 3 ساعات (2:31:36)

الأسبوع الرابع - أنماط هندسة البيانات على مستوى المؤسسات

  1. أنماط تصميم مهندس البيانات في ميتا - محاسبة النمو - الأسبوع 4 اليوم 1 (1:27:15)
  2. أنماط تصميم هندسة البيانات في ميتا - تحليل المسار التحويلي - الأسبوع 4 اليوم 1 (1:18:19)
  3. مشاريع التخرج الجاهزة للوظيفة لهندسة التحليلات (32:50)

الأسبوع الخامس - التفكير المنتج ومؤشرات الأداء الرئيسية (KPIs)

  1. هندسة البيانات كمدير منتج - مؤشرات الأداء الرئيسية والتجارب - الأسبوع 5 (2:37:06)

الأسبوع السادس - صيانة خطوط أنابيب البيانات والتصور

  1. صيانة خطوط أنابيب البيانات مثل نتفليكس وإير بي إن بي - الأسبوع 6 (2:24:43)
  2. بناء قيمة تجارية مدفوعة بالبيانات باستخدام تصورات تابلو - الأسبوع 6 (1:49:41)

مميزات الدورة

تغطية المكدس التقني

  • أباتشي سبارك: ضبط الذاكرة، عمليات الربط، استراتيجيات التقسيم
  • أباتشي كافكا: معالجة تدفق البيانات في الوقت الفعلي
  • أباتشي فلينك: إطار عمل معالجة التدفق
  • آيسبرغ: تنسيق جدول بحيرة البيانات
  • بيانات NBA: ممارسة قواعد بيانات الرسوم البيانية
  • تابلو: تصور البيانات

ممارسات على مستوى المؤسسات

  • أنماط تصميم هندسة البيانات لشركة ميتا
  • استراتيجيات صيانة خطوط أنابيب البيانات لنتفليكس وإير بي إن بي
  • نمذجة بيانات الأحداث على نطاق واسع
  • إدارة عقود البيانات

التعلم القائم على المشاريع

  • بناء رسم بياني لشبكة لاعبي NBA
  • تنفيذ عملية MIDAS من Airbnb
  • تطوير خط أنابيب بيانات شامل
  • مشاريع معالجة التدفق في الوقت الفعلي

الفئة المستهدفة

  • مبتدئو هندسة البيانات
  • المطورون الذين يرغبون في تحسين مهارات معالجة البيانات الضخمة
  • المهندسون الذين يرغبون في تعلم بنية البيانات على مستوى المؤسسات
  • الفنيون المهتمون بمعالجة البيانات في الوقت الفعلي

مخرجات التعلم

  • إتقان مكدس تقنيات هندسة البيانات الحديثة
  • فهم أفضل ممارسات معالجة البيانات على مستوى المؤسسات
  • امتلاك القدرة على بناء خطوط أنابيب بيانات قابلة للتوسع
  • تعلم نمذجة البيانات والتفكير في تصميم البنية