Data engineer DWH в Маркет

Яндекс

Data engineer DWH в Маркет

Описание вакансии

Яндекс Маркет — один из крупнейших мультикатегорийных маркетплейсов, которым ежедневно пользуются миллионы людей. Наши команды помогают покупателям приобретать товары не выходя из дома и получать заказы по всей стране, а партнёрам — развивать свой бизнес, повышая продажи и привлекая новых клиентов.

Мы команда инженеров данных, и продукт нашей команды — Data WareHouse (хранилище данных), которое мы строим для нужд бизнес-подразделений. Нашими пользователями являются как руководители Маркета, которым нужна отчётность для принятия решений, так и эксперты в области глубокого анализа данных. Можно утверждать, что все бизнес-подразделения Маркета являются потребителями поставляемых нами данных.

Технологически ядро хранилища построено на системах хранения данных YTsaurus и СlickHouse. Разработка процессов ETL идёт на собственном фреймворке, который создан внутри Яндекса.

Наше хранилище данных сейчас одно из самых крупных в России — порядка 30 петабайт — и с учётом темпов роста бизнеса оно будет самым большим. Стоит отметить, что к нему предъявляются высокие требования по надёжности, что ставит перед нашей командой далеко не тривиальные задачи, для которых нет готовых решений.

Какие задачи вас ждут

  • вести разработку ETL-процессов поставки данных;
  • выявлять неэффективность в существующих процессах и оптимизировать их;
  • проектировать структуру хранения данных;
  • участвовать в развитии фреймворка поставки данных;
  • погружаться в данные одной из прикладных бизнес-областей и становиться в них экспертом;
  • сопровождать разработанные процессы ETL.

Мы ждём, что вы

  • уверенно знаете Python на уровне написания собственного фреймворка и SQL на уровне оптимизации запросов;
  • знаете основные алгоритмы и структуры данных, особенно используемые в области работы с большими данными.

Будет плюсом, если вы

  • проектировали DWH: слои, модели хранения данных, процессы ETL;
  • понимаете принципы работы хотя бы одной технологии распределенной обработки данных: Hadoop, ClickHouse;
  • имеете опыт промышленной разработки на одном из языков высокого уровня: Java или C++;
  • умеете работать в командной строке систем Unix-like: Linux, macOS.
Навыки
  • Python
  • SQL
  • ETL
Посмотреть контакты работодателя

Похожие вакансии

WILDBERRIES
Полный день
  • Москва

  • Не указана

Рекомендуем
Яндекс
Полный день
  • Москва

  • Не указана

Рекомендуем
М.Видео-Эльдорадо

Data Engineer

М.Видео-Эльдорадо

Полный день
  • Москва

  • Не указана

Рекомендуем
ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Инженер данных (Платформа данных ТОТ)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • Не указана

СБЕР

Data engineer

СБЕР

Полный день
  • Москва

  • Не указана

ГКУ Инфогород

Инженер данных

ГКУ Инфогород

Полный день
  • Москва

  • Не указана

WILDBERRIES
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Яндекс
Полный день
  • Москва

  • Не указана

Лига Цифровой Экономики

Data Engineer

Лига Цифровой Экономики

Удаленная работа
  • Москва

  • Не указана

ARK
Полный день
  • Москва

  • Не указана

ТПС Недвижимость

Разработчик DWH, ETL

ТПС Недвижимость

Полный день
  • Москва

  • Не указана

Рокетбанк

Data Engineer

Рокетбанк

Полный день
  • Москва

  • Не указана

ZELDIS
Полный день
  • Москва

  • до 400000 RUR

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Data Engineer (Сервисные коммуникации)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • до 400000 RUR

Axenix (ранее Accenture)

Data Engineer

Axenix (ранее Accenture)

Удаленная работа
  • Москва

  • до 400000 RUR

СБЕР
Полный день
  • Москва

  • до 400000 RUR

Лемана ПРО

Дата инженер

Лемана ПРО

Полный день
  • Москва

  • до 400000 RUR

СБЕР
Полный день
  • Москва

  • до 400000 RUR

РСХБ-Интех

Data Engineer NLP

РСХБ-Интех

Удаленная работа
  • Москва

  • до 400000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию