разработка, сопровождение и мониторинг ETL/ ELT процессов для забора данных из разнородных источников;
автоматизация сбора и обработки данных из распределенных систем (Hadoop, Greenplum) и файловых источников (Excel, CSV);
проектирование, написание и оптимизация SQL-запросов и скриптов (Python) для трансформации и "укладки" данных в целевую базу данных;
сопровождение и развитие витрин данных для аналитиков и продуктовых команд;
обеспечение качества, целостности и актуальности данных в витринах;
взаимодействие с бизнес-аналитиками и владельцами отчетов для уточнения требований к данным.
Требования:
высшее образование по направлению: экономика, финансы, математика, технические специальности;
опыт работы в финансовой сфере (банк, финтех, страхование) от 3-х лет;
уверенное знание SQL (JOIN, оконные функции, оптимизация, партиционирование), Python (Pandas, SQLAlchemy, прикладные скрипты для обработки данных), Hadoop/ Spark/ HDFS (Spark SQL, работа с большими объёмами), Greenplum/ PostgreSQL или аналогичные DWH-системы;
понимание полного цикла данных: от сырого источника до витрины;
готовность работать в команде и взаимодействовать с аналитиками и владельцами отчётов.