Привет! Это команда DWH, мы находимся в поиске разработчика аналитического хранилища Ozon, умеющего работать с большими данными, оптимизировать SQL запросы, строить ETL процессы, разбирать ошибки, общаться с бизнес-пользователями и аналитиками.
Наш стэк: Vertica, Hadoop, Spark, Jupyter Notebook, Python, Airflow, Docker.
Вы будете:
- Разрабатывать и развивать ETL-системы, обслуживающие информацию для различных предметных областей: продажи, учёт, логистика.
- Анализировать данные, заниматься дизайном структур данных для аналитических потребностей различных бизнес-подразделений.
- Оптимизировать и мониторить pipeline обработки данных – мы следим за нашими инструментами и хотим чтобы они работали максимально производительно.
- Заниматься дизайном и реализацией масштабируемого хранилищ на базе HP Vertica, Trino, ClickHouse, PostgreSQL, Hadoop.
Нам важно:
- Хорошие умения проектировать и реализовывать ETL-процессы. Обязательно знание AirFlow. Наши бизнес-процессы многообразны и постоянно эволюционируют, что сказывается на ETL-процессах.
- Отличные знания SQL и наличие системного мышления.
- Опыт разработки хранилищ данных с одной из колоночных СУБД: Vertica, Greenplum, Exadata, Teradata. Отдел BI проектирует и реализует аналитическую модель предприятия, с которой удобно работать пользователям. Эти навыки помогают нам строить хранилища данных эффективно.
- Наличие опыта программирования на Python для разработки решения автогенерации задач ETL и способность реализовать логические алгоритмы.
- Навыки работы с Bash, Docker.
- Самостоятельность в решении поставленных задач. Наличие опыта ключевым разработчиком на крупном проекте. Проектирование архитектуры хранения и связанного ETL. Экспертное управление техническими требованиями к проекту, с аргументацией правок и предложениями свежих решений.
Будет плюсом:
- Опыт работы со Spark.
- Опыт работ работы с несколькими инструментами ETL и навыки использования их в горизонтально масштабируемых инструментах обработки данных. Наша компания ежегодно испытывает двукратный рост по объёму данных. Мы даём возможность применять в работе эти инструменты.
- Знания в одной из областей: CI/CD, фронтенд/бэкенд разработка, разработка интеграционных потоков.
- Желание попробовать свои силы в управлении проектом и выводить в production фичи, за которые вы будете испытывать гордость.
- Желание быть наставником в команде.