Tercera etapa: Datos e ingeniería de características

Bootcamp gratuito de 6 semanas de ingeniería de datos creado por Data with Zach, que cubre modelado de datos, procesamiento de big data, procesamiento de flujo en tiempo real y otras prácticas de ingeniería de datos de nivel empresarial.

DataEngineeringApacheSparkBigDataYouTubeVideoFreeEnglish

6-week Free Data Engineering Boot Camp Launch Video
6-week Data Engineering Boot Camp Kick off and Informational video
Data Modeling - Complex Data Types and Cumulation - Day 1 Lecture (43:17)
Data Modeling - Cumulative Dimensions, Struct and Array - Day 1 Lab (41:17)
Data Modeling - Slowly Changing Dimensions and Idempotency - Day 2 Lecture (40:26)
Data Modeling - Building Slowly Changing Dimensions (SCDs) - Day 2 Lab (45:39)
Data Modeling - Graph Databases & Additive Dimensions - Day 3 Lecture (34:08)
Data Modeling - Building an NBA Player Network Graph - Day 3 Lab (42:15)

How Meta Models Big Volume Event Data - Full 4 Hour Course (3:51:54)
Spark + Iceberg in 1 Hour - Memory Tuning, Joins, Partition - Week 3 Day 1 (1:15:02)

High Performance Spark in 1 hour - DataFrame, Dataset, UDFs, Caching - Week 3 Day 2 (1:10:17)
Testing Apache Spark Jobs in CI/CD - Week 3 Day 3 (1:08:59)
Build a Gold Pipeline like Airbnb MIDAS Process - Week 3 Day 1 Analytics (1:19:47)
Master Data Contracts in 25 minutes! - Week 3 Day 2 Analytics (27:36)
Master Real-time Data Pipelines with Kafka and Flink - 3 hr Course (2:31:36)

Data Engineer Design Patterns at Meta - Growth Accounting - Week 4 Day 1 (1:27:15)
Data Engineering Design Patterns at Meta - Funnel Analysis - Week 4 Day 1 (1:18:19)
Job-Ready Capstone Projects for Analytics Engineering (32:50)

Data Engineering like a Product Manager - KPIs & Experiments - Week 5 (2:37:06)

Apache Spark: Optimización de memoria, operaciones de unión (joins), estrategias de particionamiento
Apache Kafka: Procesamiento de flujos de datos en tiempo real
Apache Flink: Framework de procesamiento de flujos
Iceberg: Formato de tabla de lago de datos
Datos de la NBA: Práctica de bases de datos de grafos
Tableau: Visualización de datos