Привет! Это команда DWH, мы находимся в поиске разработчика аналитического хранилища Ozon, умеющего работать с большими данными, оптимизировать SQL запросы, строить ETL процессы, разбирать ошибки, общаться с бизнес-пользователями и аналитиками.
Наш стэк: Vertica, Hadoop, Trino, Spark, Jupyter Notebook, Python, Airflow, Docker.
Вы будете
- Разрабатывать и развивать ETL-системы, обслуживающие информацию для различных предметных областей: продажи, учёт, логистика.
- Анализировать данные, заниматься дизайном структур данных для аналитических потребностей различных бизнес-подразделений.
- Оптимизировать и мониторить pipeline обработки данных – мы следим за нашими инструментами и хотим чтобы они работали максимально производительно.
- Заниматься дизайном и реализацией масштабируемого хранилищ на базе HP Vertica, Trino, Hadoop.
Примеры задач
- Разработать новый объект детального слоя в домене Wishlist.
- Разработать витрину вишлистов пользователей.
Нам важно
- Теоретические знания Баз данных (включая алгоритмы SCD).
- Продвинутые навыки SQL (включая оконные функции, понимание плана запроса и подходов к оптимизации).
- Базовые знание в Python и способность реализовать логические алгоритмы.
- Навыки работы с Aiflow или другим ETL инструментом.
- Навыки работы с Bash.
- Знания в архитектуре корпоративных хранилищ и организации потоков данных.
Будет плюсом
- Опыт работы с Vertica, Hadoop, Trino, Spark.
- Опыт работ работы с несколькими инструментами ETL и навыки использования их в горизонтально масштабируемых инструментах обработки данных.
- Знания в одной из областей: CI/CD, разработка интеграционных потоков.