Middle Data Engineer

RUTUBE

Middle Data Engineer

Москва, Ленинградский проспект, 72к4

Метро: Аэропорт

Описание вакансии

RUTUBE — крупнейшая российская видеоплатформа с 15 млн DAU и 80 млн MAU. Мы строим новую рекламную платформу, будущего лидера на рынке видеорекламы.
Мы ищем мидл продукт-менеджера, который усилит команду и поможет нам развивать рекламные продукты Rutube: от рекламного кабинета до алгоритмов показа и повышения монетизации.

Тебе предстоит:

  • Построение ETL-пайплайнов (Spark на Scala, Trino, DBT);
  • Разработка ETL-инструментов для обработки данных (Scala, Python);
  • Разработка внутренних API-сервисов (Python);
  • Техническое сопровождение платформы данных.

Мы ожидаем:

  • Уверенное владение Python;
  • Уверенные знания SQL (оконные функции, оптимизация запросов);
  • Глубокое знание Apache Spark (Python/Scala);
  • Опыт работы с S3 и понимание, чем оно отличается от распределенной файловой системы (HDFS);
  • Опыт работы с форматами файлов: Parquet, ORC, AVRO - в чем различия, какой тип для какой задачи лучше подходит;
  • Опыт работы с Kafka, Spark Streaming / Kafka Streams - понимание проблем в NRT-процессах и методы их решения;
  • Опыт работы с табличными форматами Apache Iceberg / Hudi / Delta Lake;
  • Опыт работы c Docker, K8s;
  • Опыт работы с Airflow;
  • Понимание принципов параллельной обработки данных, какие могут быть сложности и как они решаются;
  • Умение находить "узкие" места в ETL-процессах и оптимизировать их;
  • Понимание концепции хранилища DWH - какие слои выделяют и для чего + понимание концепции DataLakeHouse.
  • Преимуществом будет:
    - Знание Scala или другого Java-подобного языка
    - Опыт работы с MPP системами (GreenPlum / Hadoop / StarRocks)
    - Опыт работы с DBT (Data Build Tool)

Работать у нас комфортно:

​​​​​​Офис, где приятно быть
— Уютное пространство с зонами коворкинга — выбирай, где работать

Здоровье под защитой
— ДМС (стоматология включена)
— Врач прямо в офисе

Вкусно и бесплатно
— Фреш-бар от Novikov Group
— Кофе, чай, фрукты, снэки — каждый день

Отдых без компромиссов
— Обеденные зоны с настолками и массажными креслами Yamaguchi

Оформление по ТК РФ
— Всё официально

Навыки
  • Python
  • Apache Airflow
  • Apache Kafka
  • Apache Spark
  • ETL
  • Scala
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Цифровой аудит

Data Engineer

Цифровой аудит

  • Москва

  • Не указана

Рекомендуем
ИЦ АЙ-ТЕКО

Data Engineer

ИЦ АЙ-ТЕКО

  • Москва

  • Не указана

Рекомендуем
X5 Tech
  • Москва

  • Не указана

Рекомендуем
ИЦ АЙ-ТЕКО
  • Москва

  • Не указана

Флаувау

Data Engineer (GCP)

Флаувау

  • Москва

  • Не указана

Яндекс
  • Москва

  • Не указана

Rubytech

Data Engineer

Rubytech

  • Москва

  • Не указана

RWB (Wildberries & Russ)

Senior Data Engineer

RWB (Wildberries & Russ)

  • Москва

  • Не указана

Тера Интегро

Data engineer (оптимизация)

Тера Интегро

  • Москва

  • Не указана

Цифровой аудит

Инженер данных

Цифровой аудит

  • Москва

  • Не указана

Эвокарго

Lead Data Engineer

Эвокарго

  • Москва

  • Не указана

Тера Интегро

Data Engineer (S3, Spark)

Тера Интегро

  • Москва

  • Не указана

Rostic’s (Интернэшнл Ресторант Брэндс)

Старший Дата-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

Robusta
  • Москва

  • Не указана

Криптонит
  • Москва

  • Не указана

ТехВилл
  • Москва

  • до 300000 RUR

Криптонит

SDET Engineer

Криптонит

  • Москва

  • до 300000 RUR

АльфаСтрахование

Data Scientist (Classic ML)

АльфаСтрахование

  • Москва

  • до 300000 RUR

СБЕРКОРУС
  • Москва

  • до 300000 RUR

Лаборатория Касперского

MLOps Engineer

Лаборатория Касперского

  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию