поиск источников данных, исследование и анализ больших объемов данных, выявление выбросов и неочевидных зависимостей;
обеспечение качества данных, включая формирование требований к качеству, мониторинг, анализ, коммуникация со смежными подразделениями для устранения причин и следствий проблем с качеством данных;
сбор, обработка и анализ данных из разных источников, подготовка выгрузок с помощью SQL -скриптов по выставленным бизнес-требованиям;
оптимизация запросов на SQL для эффективного получения данных;
создание и поддержка отчетов и дашбордов в BI-системах (например, Superset, PixBI);
участие в разработке и внедрении аналитических процессов;
аd hoc аналитика по запросу для быстрого принятия решений;
помощь команде в принятии data driven решений.
Требования:
высшее образование;
уверенное знание SQL для работы с большими массивами данных в кластере HADOOP, опыт работы со Spark, знание Python;
аналитическое мышление и умение структурировать информацию;
способность работать в команде и ясно объяснять результаты анализа;
опыт работы от 2 лет на позициях, связанных с обработкой и анализом; данных;
желательно - продвинутый пользователей Microsoft Office Excel, написание мер с помощью DAX;
базовое понимание основных банковских продуктов и процессов, опыт работы с BI-инструментами (Superset, Power BI) - желательно.