Мы — команда направления хранения и обработки данных Ozon Tech. Мы создаем и развиваем основное хранилище данных DWH, которое является основой для аналитики и ключевых бизнес-решений в таких областях, как продажи, логистика, маркетинг и финансы.
Ты будешь
- Профилировать данные из различных бизнес-областей: продажи, учёт, логистика, маркетинг.
- Разрабатывать и улучшать ETL-процессы (извлечение, преобразование, загрузка) с использованием Airflow, Python и SQL.
- Мониторить, расследовать и исправлять инциденты в пайплайнах обработки данных.
- Оптимизировать SQL-запросы.
- Участвовать в реализации и развитии масштабируемых хранилищ данных на базе Vertica, ClickHouse, Hadoop.
Нам важно
- Теоретические знания баз данных, включая нормальные формы.
- Хорошие навыки SQL (SELECT запросы с WHERE, ORDER BY и GROUP BY включая использование оконных функций)
- Понимание логики работы и отличий разных типов JOIN.
- Базовые знания Python, достаточные для реализации логических алгоритмов.
- Готовность изучать новые технологии и инструменты, внимательность к деталям.
Будет плюсом:
- Навыки работы с Bash.
- Опыт работы с Docker.
- Наличие учебных, pet- или коммерческих проектов на GitHub.