Data Engineer (направление качества пунктов выдачи)

Ozon

Data Engineer (направление качества пунктов выдачи)

Москва, Московский международный деловой центр Москва-Сити, многофункциональный комплекс Башня на Набережной

Метро: Деловой центр

Описание вакансии

В подгруппу инфраструктуры данных требуется инженер данных для выполнения задач по изменению и развитию инфраструктуры данных в соответствии с общими изменениями в компании, включая переход на собственную схему хранения данных.

Вам предстоит:

Построение и поддержка ETL/пайплайнов:

Разработка, оптимизация и мониторинг для гарантированной доставки данных.

Развитие сервисной модели для аналитиков:

Предоставление качественных, документированных и актуальных данных через витрины и инструменты автоматизации, сокращая время на рутинные запросы.

Повышение надежности и прозрачности:

Помощь во внедрении единых стандартов на тестирование, мониторинг и алертинг для всех data-процессов.

Технологический стек проекта:

Оркестрация: Apache Airflow. Обработка данных: SQL, Python (Pandas), Apache Spark (PySpark).

Аналитические СУБД: ClickHouse, Vertica, Trino

Инфраструктура и инструменты: Git, Docker, Hadoop (HDFS, Hive), Kafka. Язык программирования: Python (Pandas, requests, асинхронное программирование).

Мы ожидаем:

Знание SQL (CTE, оконные функции, оптимизация запросов).

Базовые навыки профилирования и оптимизации SQL-запросов (чтение explain plan, понимание индексов).

Понимание принципов построения ETL/ELT-пайплайнов и опыт работы с Apache Airflow.

Базовые знания Python для целей обработки данных (Pandas, PySpark). Опыт работы с Git.

Понимание концепций распределенных систем и работы с большими данными (архитектура Spark, Kafka, Hadoop).

Будет преимуществом:

Практический опыт работы с Apache Kafka. Знание специфики ClickHouse (движки таблиц, особенности кластерной работы).

Опыт работы с Vertica/Trino. Навыки работы с Docker и оркестраторами (Rancher/Kubernetes).

Понимание принципов работы gRPC.

Привычка к ведению документации, понимание принципов Data Catalog (что такое глоссарий, метаданные, lineage).

Навыки
  • Clickhouse
  • Vertica
  • ETL
  • Python
  • Ozon офис и коммерция
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Цифровой аудит

Data Engineer

Цифровой аудит

  • Москва

  • Не указана

Рекомендуем
Тера Интегро

Data engineer (DBT)

Тера Интегро

  • Москва

  • Не указана

Рекомендуем
Ozon
  • Москва

  • Не указана

Рекомендуем
М.Видео-Эльдорадо

Data-инженер

М.Видео-Эльдорадо

  • Москва

  • Не указана

Тера Интегро

Data Engineer (Spark, NiFi)

Тера Интегро

  • Москва

  • Не указана

Rostic’s (Интернэшнл Ресторант Брэндс)

Старший Дата-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

Ozon
  • Москва

  • Не указана

Криптонит
  • Москва

  • Не указана

АНО ЦИСМ

Data Engineer

АНО ЦИСМ

  • Москва

  • Не указана

  • Москва

  • до 350000 RUR

МТС Банк

Эксперт Data Science

МТС Банк

  • Москва

  • до 350000 RUR

Сбер Бизнес Софт

Data Scientist (NLP / LLM / RAG)

Сбер Бизнес Софт

  • Москва

  • до 350000 RUR

билайн
  • Москва

  • до 300000 RUR

Сбер Бизнес Софт
  • Москва

  • до 300000 RUR

АТОЛ, группа компаний

Инженер по обеспечению качества

АТОЛ, группа компаний

  • Москва

  • до 300000 RUR

EcoFinance
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию