Ищем Инженер ETL на проект Альфа-банка (Создание ETL-проектов, развитие Feature Store). Продолжительность проекта - 1 год.
Задачи:
Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка.
Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения.
Разработка и поддержание в актуальном состоянии документации по разработанному функционалу.
Своевременное отражение статуса выполнения задач в Jira.
Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных.
Требования:
Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП и ФП.
Опыт написания модульных и интеграционных тестов.
Знание и опыт применения библиотек обработки и анализа данных - numpy, pandas.
Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников.
Способность разобраться с API поставщиков данных, используя доступную документацию.
SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности.
Опыт работы с БД Oracle.
Условия:
Интересные задачи.
Гибкое начало рабочего дня.
Часовой пояс Москва (UTC+03:00, Europe/Moscow) ± 2 ч
ЗП до 190 000 net (ТК РФ), до 250 000 gross (ИП)
Трудоустройство в штат компании по ТК или ИП, формат аутстафф.
Удаленный формат работы (full-time)
Ключевые компетенции: SQL, PostgreSQL, Python, API, Greenplum, Airflow, pandas, Oraсle, numpy, Pyspark, json/xml
Ждем ваш отклик, чтобы обсудить вакансию подробнее!
Инновации и производство
Москва
до 200000 RUR
Москва
до 500000 RUR
Торговый центр Пиастрелла
Москва
от 200000 RUR