Ищем инженера данных в команду проекта "Прогнозирование". Команда разрабатывает аналитические алгоритмы предсказания продаж и других ключевых метрик.
Чем предстоит заниматься:
- Разрабатывать ETL/ELT-пайплайны сбора и обработки данных, необходимых для построения алгоритмов и ML-моделей;
- Разрабатывать приложения потоковой / пакетной обработки clickstream данных;
- Разрабатывать автоматизированные пайплайны расчета алгоритмов и скоринга ML-моделей;
- Разрабатывать сервисы поверх ML-моделей и выстраивать их мониторинг;
- Сопровождать data sciencе специалистов в продуктовых командах, внедрять разработанные ML-модели и алгоритмы в production.
Наш стек:
- Для разработки: Python, Oracle PL/SQL, PostgreSQL, Spark, Spark Streaming, Impala/Hive, Kafka, Airflow;
- Для организации работы: Jira, Confluence, BitBucket.
Мы ждём от будущих коллег:
- Высшее техническое образование;
- Опыт работы в качестве Data Engineer или аналитика-разработчика (рассмотрим аналитика, который хочет развиваться в разработке);
- Навыки написания сложных SQL запросов и их оптимизации;
- Опыт разработки и автоматизации пайплайнов обработки данных;
- Будет преимуществом уверенное владение Python (структуры данных, пакеты для обработки данных).