Мы – команда анализа данных в Дирекции по корпоративному развитию и финансам.
Наши продукты: аналитические витрины данных, дашборды, рассылки чат-ботами и ML-предсказания.
Что под капотом: путь от сырых данных в топиках через слои, в которые интерпретируем или раскладываем данные на якорную модель, до структуры и формата, с которыми заказчикам просто и приятно работать.
Чем предстоит заниматься:
- разрабатывать и поддерживать ETL-процессы для построения витрин по юнит-экономике в Vertica и Trino;
- проектировать витрины данных (иногда – с использованием якорной модели) – поддерживать и развивать существующие модели, добавлять новые сущности и атрибуты;
- создавать и оптимизировать дашборды в Apache Superset для бизнес-команд и производства;
- участвовать в автоматизации рутинных процессов: расчёты метрик, контроль качества данных, data lineage, алертинг ботами;
- готовить ad-hoc отчёты и поддерживать существующие скрипты и пайплайны;
- работать вместе с заказчиками над формулированием задачи и форматом решения.
Мы ждём, что вы:
- уверенно пишете запросы SQL (оконки, CTE, работа с очень большими объёмами данных и оптимизация запросов);
- имеете базовый опыт Python (pandas, чтение/запись данных, написание простых скриптов);
- понимаете, как устроены ETL-процессы, Airflow (или готовы быстро вникнуть);
- готовы разбираться в бизнес-логике метрик юнит-экономики и не стесняться спрашивать, какой физический смысл имеет та или иная метрика и аналитика;
- готовы меняться и изучать новое: наша команда следует стандартам, которые задает платформа, а сами задачи позволят детально изучить бизнес Ozon.
Почему у нас интересно:
- стек технологий постоянно меняется – скучно не будет;
- задачи очень разные, а способы выполнения часто рождаются в процессе живого общения с заказчиками или между аналитиками;
- инициативы приветствуются.