Senior Data Engineer

RUTUBE

Senior Data Engineer

Москва, Ленинградский проспект, 72к4

Метро: Аэропорт

Описание вакансии

RUTUBE — крупнейшая российская видеоплатформа с 15 млн DAU и 80 млн MAU. Мы строим новую рекламную платформу, будущего лидера на рынке видеорекламы.
Мы ищем мидл продукт-менеджера, который усилит команду и поможет нам развивать рекламные продукты Rutube: от рекламного кабинета до алгоритмов показа и повышения монетизации.

Тебе предстоит:

  • Построение ETL-пайплайнов (Spark на Scala, Trino, DBT);
  • Разработка ETL-инструментов для обработки данных (Scala, Python);
  • Разработка внутренних API-сервисов (Python);
  • Техническое сопровождение платформы данных.

Мы ожидаем:

  • Уверенное владение Python;
  • Уверенные знания SQL (оконные функции, оптимизация запросов);
  • Глубокое знание Apache Spark (Python/Scala);
  • Опыт работы с S3 и понимание, чем оно отличается от распределенной файловой системы (HDFS);
  • Опыт работы с форматами файлов: Parquet, ORC, AVRO - в чем различия, какой тип для какой задачи лучше подходит;
  • Опыт работы с Kafka, Spark Streaming / Kafka Streams - понимание проблем в NRT-процессах и методы их решения;
  • Опыт работы с табличными форматами Apache Iceberg / Hudi / Delta Lake;
  • Опыт работы c Docker, K8s;
  • Опыт работы с Airflow;
  • Понимание принципов параллельной обработки данных, какие могут быть сложности и как они решаются;
  • Умение находить "узкие" места в ETL-процессах и оптимизировать их;
  • Понимание концепции хранилища DWH - какие слои выделяют и для чего + понимание концепции DataLakeHouse.
  • Преимуществом будет:
    - Знание Scala или другого Java-подобного языка
    - Опыт работы с MPP системами (GreenPlum / Hadoop / StarRocks)
    - Опыт работы с DBT (Data Build Tool)

Работать у нас комфортно:

​​​​​​Офис, где приятно быть
— Уютное пространство с зонами коворкинга — выбирай, где работать

Здоровье под защитой
— ДМС (стоматология включена)
— Врач прямо в офисе

Вкусно и бесплатно
— Фреш-бар от Novikov Group
— Кофе, чай, фрукты, снэки — каждый день

Отдых без компромиссов
— Обеденные зоны с настолками и массажными креслами Yamaguchi

Оформление по ТК РФ
— Всё официально

Навыки
  • Python
  • Apache Airflow
  • Apache Kafka
  • Apache Spark
  • ETL
  • Scala
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Цифровой аудит

Lead Data Engineer

Цифровой аудит

  • Москва

  • Не указана

Рекомендуем
Платформа Третье Мнение

Инженер по данным (Data Engineer)

Платформа Третье Мнение

  • Москва

  • Не указана

Рекомендуем
Ак Барс Цифровые Технологии

Data Engineer

Ак Барс Цифровые Технологии

  • Москва

  • Не указана

Рекомендуем
585, Холдинг

AI Lead

585, Холдинг

  • Москва

  • Не указана

Rubytech

Data Engineer

Rubytech

  • Москва

  • Не указана

Яндекс
  • Москва

  • Не указана

Rostic’s (Интернэшнл Ресторант Брэндс)

Senior Data-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

EcoFinance
  • Москва

  • Не указана

Notamedia
  • Москва

  • Не указана

EcoFinance
  • Москва

  • Не указана

ГКУ Инфогород
  • Москва

  • Не указана

Газпромбанк

Team Lead AI/ML

Газпромбанк

  • Москва

  • Не указана

Мультифактор
  • Москва

  • Не указана

Домклик
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию