Data Engineer (направление качества пунктов выдачи)

Ozon

Data Engineer (направление качества пунктов выдачи)

Москва, Московский международный деловой центр Москва-Сити, многофункциональный комплекс Башня на Набережной

Метро: Деловой центр

Описание вакансии

В подгруппу инфраструктуры данных требуется инженер данных для выполнения задач по изменению и развитию инфраструктуры данных в соответствии с общими изменениями в компании, включая переход на собственную схему хранения данных.

Вам предстоит:

Построение и поддержка ETL/пайплайнов:

Разработка, оптимизация и мониторинг для гарантированной доставки данных.

Развитие сервисной модели для аналитиков:

Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.

Повышение надежности и прозрачности:

Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.

Технологический стек проекта:

Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).

Аналитические СУБД: ClickHouse, Vertica, Trino

Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).

Мы ожидаем:

Знание SQL (CTE, оконные функции, оптимизация запросов).

Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).

Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.

Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.

Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).

Будет преимуществом:

Практический опыт работы с Apache Kafka. Знание специфики ClickHouse (движки таблиц, особенности кластерной работы).

Опыт работы с Vertica/Trino. Навыки работы с Docker и оркестраторами (Rancher/Kubernetes).

Понимание принципов работы gRPC.

Привычка к ведению документации, понимание принципов Data Catalog (что такое глоссарий, метаданные, lineage).

Навыки
  • Clickhouse
  • Vertica
  • ETL
  • Python
  • Ozon офис и коммерция
Посмотреть контакты работодателя

Адрес

Похожие вакансии

СБЕРКОРУС
  • Москва

  • Не указана

Рекомендуем
ЭКОПСИ Консалтинг

Junior Data Engineer

ЭКОПСИ Консалтинг

  • Москва

  • Не указана

Рекомендуем
Cloud.ru

Data Engineer

Cloud.ru

  • Москва

  • Не указана

Рекомендуем
Менеджед Деплоймент

Middle Data Engineer / ETL-разработчик

Менеджед Деплоймент

  • Москва

  • Не указана

Ozon
  • Москва

  • Не указана

АНО ЦИСМ

Data Engineer

АНО ЦИСМ

  • Москва

  • Не указана

EcoFinance
  • Москва

  • Не указана

.redev
  • Москва

  • Не указана

Тера Интегро

Data engineer (DBT)

Тера Интегро

  • Москва

  • Не указана

СберЗдоровье

Analytics Engineer (DWH)

СберЗдоровье

  • Москва

  • Не указана

WILDBERRIES

Data engineer

WILDBERRIES

  • Москва

  • Не указана

ТрансЛом

DevOps-инженер

ТрансЛом

  • Москва

  • Не указана

  • Москва

  • Не указана

Т-Банк

SRE-инженер

Т-Банк

  • Москва

  • Не указана

ТехВилл

DevOps-инженер

ТехВилл

  • Москва

  • Не указана

ARK
  • Москва

  • Не указана

2ГИС
  • Москва

  • Не указана

МАГНИТ, Розничная сеть

Data Scientist

МАГНИТ, Розничная сеть

  • Москва

  • Не указана

Онкодиагностика Атлас

Data Engineer / Platform Engineer (Kubernetes, pipelines)

Онкодиагностика Атлас

  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию