Москва
Понимание работы СУБД и принципов построения хранилищ данных. Опыт работы с Hadoop (Spark, HDFS, YARN etc.). Отличное знание SQL, Python...
Разрабатывать витрины данных. Интегрировать новые источники данных в DataLake. Обрабатывать потоковые данные (streaming). Контролировать качество загружаемых данных. Проводить код ревью.