Data Engineer (Middle) / Инженер по данным

Data Engineer (Middle) / Инженер по данным

Москва, Леонтьевский переулок, 21/1с1

Метро: Тверская

Описание вакансии

О нас

Мы продуктовая ad-tech команда. Обрабатываем большие потоки событий (показы, клики, конверсии), строим атрибуцию, антифрод и пользовательскую идентификацию.
Работаем с высоконагруженным DWH и near-real-time аналитикой.

Ищем data-engineer, который будет заниматься инженерной частью данных: пайплайнами, хранением, оптимизацией и надежностью.

Чем предстоит заниматься

DWH и хранение данных

  • Проектирование таблиц и витрин (raw → stage → mart)
  • Партиционирование, TTL, дедупликация
  • Schema evolution
  • Оптимизация стоимости хранения

ETL/ELT пайплайны

  • Разработка DAG’ов в Airflow
  • Инкрементальные загрузки
  • Исторические перерасчёты (backfill)
  • Обработка late events
  • Идемпотентные пайплайны и ретраи

Обработка больших объемов данных

  • Сложные join’ы по user identity
  • Сборка цепочек событий
  • Подготовка витрин для аналитики
  • Работа с массивами и nested структурами

Оптимизация

  • Поиск узких мест в запросах
  • Переписывание тяжелых SQL
  • Минимизация чтения данных
  • Оптимизация нагрузки на кластер

Надежность данных

  • Контроль качества данных
  • Алерты и проверки
  • Разбор инцидентов
  • Поддержка production-витрин

Наш стек

  • ClickHouse
  • Trino
  • Iceberg / Data Lake
  • S3-хранилище
  • Airflow
  • Python
  • Parquet / JSON

(Ожидаем понимание принципов, а не обязательно опыт со всеми технологиями)

Требования

Обязательно

  • Уверенный SQL (join, window functions, агрегаты)
  • Опыт разработки ETL-процессов
  • Python для обработки данных
  • Понимание партиционирования и инкрементальных загрузок
  • Опыт работы с большими таблицами (десятки/сотни миллионов строк)
  • Понимание идемпотентности, ретраев, backfill

Будет плюсом

  • ClickHouse / Presto / Trino
  • Airflow
  • Data Lake (Iceberg / Hive / Hudi)
  • Event-based системы
  • Highload или ad-tech проекты

Условия

  • Работа с большими объемами данных
  • Влияние на архитектуру
  • Инженерные задачи уровня production-DWH
  • Гибкий формат работы
  • Конкурентная зарплата (обсуждается по результатам интервью)
Навыки
  • SQL
  • ETL
  • Python
  • Clickhouse
  • Apache Airflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

EcoFinance
  • Москва

  • Не указана

Рекомендуем
АНО ЦИСМ

Data Engineer

АНО ЦИСМ

  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
Тера Интегро

Data engineer (DBT)

Тера Интегро

  • Москва

  • Не указана

Riverstart (ООО Риверстарт)

Data engineer / Инженер данных (Middle+)

Riverstart (ООО Риверстарт)

  • Москва

  • до 240000 RUR

IBS
  • Москва

  • до 240000 RUR

Flocktory
  • Москва

  • до 240000 RUR

Rostic’s (Интернэшнл Ресторант Брэндс)

Senior Data-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • до 240000 RUR

ГРЧЦ, ФГУП
  • Москва

  • до 240000 RUR

ГКУ Инфогород

Data Engineer

ГКУ Инфогород

  • Москва

  • до 240000 RUR

ИЦ АЙ-ТЕКО

Data Engineer

ИЦ АЙ-ТЕКО

  • Москва

  • до 250000 RUR

Тера Интегро

Data Engineer (Spark, NiFi)

Тера Интегро

  • Москва

  • до 250000 RUR

ГК Орбита
  • Москва

  • до 170000 RUR

Платформа ОФД

Data Engineer (Big Data) Scala

Платформа ОФД

  • Москва

  • до 220000 RUR

Альфа-Банк
  • Москва

  • до 220000 RUR

Bell Integrator

Data Engineer

Bell Integrator

  • Москва

  • до 220000 RUR

Ак Барс Цифровые Технологии

Data Engineer

Ак Барс Цифровые Технологии

  • Москва

  • до 300000 RUR

ТехВилл
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию