Москва
Опыт работы с Hadoop (HDFS, Yarn), понимание структур данных (Parquet). Опыт разработки высокопроизводительных ETL-процессов на pySpark. Глубокое знание SQL...
Разрабатывать надежные pipeline обработки данных. Создавать витрины данных. Анализировать новые источники данных, настраивать процесс загрузки данных в Data Lake.