Data Engineering
数据仓库、流处理、ETL/ELT、CDC — 把海量数据变成可用洞察的工程学
OLTP vs OLAP、星型模型、列存、Snowflake/BigQuery/Databricks、湖仓一体。
Kafka Streams / Flink / Spark Streaming——事件驱动、窗口、Exactly-Once、水位线。
Airflow 调度、dbt 转换、Debezium CDC、数据质量——让数据从源头流到报表的工程化。