3단계: 데이터 및 특징 엔지니어링
Data with Zach에서 제작한 6주 무료 데이터 엔지니어링 부트캠프. 데이터 모델링, 빅데이터 처리, 실시간 스트림 처리 등 기업 수준의 데이터 엔지니어링 실습을 다룹니다.
데이터 엔지니어링 부트 캠프 강좌 소개
강좌 개요
- 강사: Data with Zach
- 플랫폼: YouTube
- 강좌 성격: 무료 데이터 엔지니어링 부트 캠프
- 총 조회수: 234만 회 이상 조회
- 영상 수: 21개 영상
강좌 내용 구성
Week 1 - 데이터 모델링 기초
- 6주 무료 데이터 엔지니어링 부트 캠프 론칭 영상
- 6주 데이터 엔지니어링 부트 캠프 시작 및 정보 영상
- 데이터 모델링 - 복합 데이터 타입 및 누적 - 1일차 강의 (43:17)
- 데이터 모델링 - 누적 차원, 구조체 및 배열 - 1일차 실습 (41:17)
- 데이터 모델링 - 느리게 변하는 차원 및 멱등성 - 2일차 강의 (40:26)
- 데이터 모델링 - 느리게 변하는 차원(SCD) 구축 - 2일차 실습 (45:39)
- 데이터 모델링 - 그래프 데이터베이스 및 가산 차원 - 3일차 강의 (34:08)
- 데이터 모델링 - NBA 선수 네트워크 그래프 구축 - 3일차 실습 (42:15)
Week 2 - 빅데이터 처리
- Meta가 대용량 이벤트 데이터를 모델링하는 방법 - 4시간 전체 강좌 (3:51:54)
- 1시간 만에 Spark + Iceberg - 메모리 튜닝, 조인, 파티션 - 3주차 1일차 (1:15:02)
Week 3 - 고성능 데이터 처리 및 테스트
- 1시간 만에 고성능 Spark - DataFrame, Dataset, UDF, 캐싱 - 3주차 2일차 (1:10:17)
- CI/CD에서 Apache Spark 작업 테스트 - 3주차 3일차 (1:08:59)
- Airbnb MIDAS 프로세스처럼 골드 파이프라인 구축 - 3주차 1일차 분석 (1:19:47)
- 25분 만에 데이터 계약 마스터하기! - 3주차 2일차 분석 (27:36)
- Kafka와 Flink로 실시간 데이터 파이프라인 마스터하기 - 3시간 강좌 (2:31:36)
Week 4 - 엔터프라이즈 데이터 엔지니어링 패턴
- Meta의 데이터 엔지니어링 설계 패턴 - 성장 회계 - 4주차 1일차 (1:27:15)
- Meta의 데이터 엔지니어링 설계 패턴 - 퍼널 분석 - 4주차 1일차 (1:18:19)
- 분석 엔지니어링을 위한 취업 준비 캡스톤 프로젝트 (32:50)
Week 5 - 제품 사고방식 및 KPI
- 제품 관리자처럼 데이터 엔지니어링 - KPI 및 실험 - 5주차 (2:37:06)
Week 6 - 데이터 파이프라인 유지보수 및 시각화
- Netflix와 Airbnb처럼 데이터 파이프라인 유지보수 - 6주차 (2:24:43)
- Tableau Viz로 데이터 기반 비즈니스 가치 구축 - 6주차 (1:49:41)
강좌 특징
기술 스택 포함
- Apache Spark: 메모리 튜닝, 조인 작업, 파티션 전략
- Apache Kafka: 실시간 데이터 스트림 처리
- Apache Flink: 스트림 처리 프레임워크
- Iceberg: 데이터 레이크 테이블 형식
- NBA 데이터: 그래프 데이터베이스 실습
- Tableau: 데이터 시각화
엔터프라이즈 실습
- Meta사의 데이터 엔지니어링 설계 패턴
- Netflix와 Airbnb의 데이터 파이프라인 유지보수 전략
- 대규모 이벤트 데이터 모델링
- 데이터 계약 관리
프로젝트 기반 학습
- NBA 선수 네트워크 그래프 구축
- Airbnb MIDAS 프로세스 구현
- 엔드투엔드 데이터 파이프라인 개발
- 실시간 스트림 처리 프로젝트
수강 대상
- 데이터 엔지니어링 초보자
- 빅데이터 처리 기술 향상을 원하는 개발자
- 엔터프라이즈 데이터 아키텍처를 배우고 싶은 엔지니어
- 실시간 데이터 처리에 관심 있는 기술자
학습 성과
- 현대 데이터 엔지니어링 기술 스택 습득
- 엔터프라이즈 데이터 처리 모범 사례 이해
- 확장 가능한 데이터 파이프라인 구축 능력 보유
- 데이터 모델링 및 아키텍처 설계 사고방식 학습