Troisième étape : Données et ingénierie des caractéristiques
Camp d'entraînement gratuit de 6 semaines en ingénierie des données créé par Data with Zach, couvrant la modélisation des données, le traitement des mégadonnées, le traitement des flux en temps réel et d'autres pratiques d'ingénierie des données de niveau entreprise.
Présentation du Boot Camp d'Ingénierie des Données
Aperçu du Cours
- Formateur: Data with Zach
- Plateforme: YouTube
- Nature du cours: Boot camp gratuit d'ingénierie des données
- Nombre total de vues: Plus de 2,34 millions de vues
- Nombre de vidéos: 21 vidéos
Structure du Contenu du Cours
Semaine 1 - Fondamentaux de la Modélisation des Données
- 6-week Free Data Engineering Boot Camp Launch Video
- 6-week Data Engineering Boot Camp Kick off and Informational video
- Data Modeling - Complex Data Types and Cumulation - Day 1 Lecture (43:17)
- Data Modeling - Cumulative Dimensions, Struct and Array - Day 1 Lab (41:17)
- Data Modeling - Slowly Changing Dimensions and Idempotency - Day 2 Lecture (40:26)
- Data Modeling - Building Slowly Changing Dimensions (SCDs) - Day 2 Lab (45:39)
- Data Modeling - Graph Databases & Additive Dimensions - Day 3 Lecture (34:08)
- Data Modeling - Building an NBA Player Network Graph - Day 3 Lab (42:15)
Semaine 2 - Traitement des Mégadonnées
- How Meta Models Big Volume Event Data - Full 4 Hour Course (3:51:54)
- Spark + Iceberg in 1 Hour - Memory Tuning, Joins, Partition - Week 3 Day 1 (1:15:02)
Semaine 3 - Traitement des Données Haute Performance et Tests
- High Performance Spark in 1 hour - DataFrame, Dataset, UDFs, Caching - Week 3 Day 2 (1:10:17)
- Testing Apache Spark Jobs in CI/CD - Week 3 Day 3 (1:08:59)
- Build a Gold Pipeline like Airbnb MIDAS Process - Week 3 Day 1 Analytics (1:19:47)
- Master Data Contracts in 25 minutes! - Week 3 Day 2 Analytics (27:36)
- Master Real-time Data Pipelines with Kafka and Flink - 3 hr Course (2:31:36)
Semaine 4 - Modèles d'Ingénierie des Données de Niveau Entreprise
- Data Engineer Design Patterns at Meta - Growth Accounting - Week 4 Day 1 (1:27:15)
- Data Engineering Design Patterns at Meta - Funnel Analysis - Week 4 Day 1 (1:18:19)
- Job-Ready Capstone Projects for Analytics Engineering (32:50)
Semaine 5 - Pensée Produit et KPI
- Data Engineering like a Product Manager - KPIs & Experiments - Week 5 (2:37:06)
Semaine 6 - Maintenance et Visualisation des Pipelines de Données
- Maintain Data Pipelines Like Netflix and Airbnb - Week 6 (2:24:43)
- Build Data-Driven Business Value with Tableau Viz - Week 6 (1:49:41)
Caractéristiques du Cours
Couverture de la Pile Technologique
- Apache Spark: Optimisation de la mémoire, opérations de jointure, stratégies de partitionnement
- Apache Kafka: Traitement des flux de données en temps réel
- Apache Flink: Cadre de traitement de flux
- Iceberg: Format de table de lac de données
- Données NBA: Pratique des bases de données graphes
- Tableau: Visualisation des données
Pratiques de Niveau Entreprise
- Modèles de conception d'ingénierie des données chez Meta
- Stratégies de maintenance des pipelines de données chez Netflix et Airbnb
- Modélisation des données d'événements à grande échelle
- Gestion des contrats de données
Apprentissage Axé sur les Projets
- Construction d'un graphe de réseau de joueurs NBA
- Implémentation du processus MIDAS d'Airbnb
- Développement de pipelines de données de bout en bout
- Projets de traitement de flux en temps réel
Public Cible
- Débutants en ingénierie des données
- Développeurs souhaitant améliorer leurs compétences en traitement des mégadonnées
- Ingénieurs désireux d'apprendre l'architecture des données de niveau entreprise
- Professionnels de la technologie intéressés par le traitement des données en temps réel
Acquis d'Apprentissage
- Maîtriser la pile technologique moderne de l'ingénierie des données
- Comprendre les meilleures pratiques de traitement des données de niveau entreprise
- Acquérir la capacité de construire des pipelines de données évolutifs
- Apprendre la modélisation des données et la pensée de conception architecturale