Data Engineer Senior

DOGMA

Data Engineer Senior

Москва, Садовая-Кудринская улица, 1

Метро: Баррикадная

Описание вакансии

Вам предстоит:

Data Warehouse:

  • Проектирование и построение DWH в ClickHouse с нуля: схемы, партиционирование, TTL, материализованные представления;
  • Подключение всех источников данных компании: CRM, сайт, колл-трекинг, 1С, СОД, ERP — 100% покрытие к концу Фазы 1;
  • Стандартизация форматов данных между разными системами — единая модель для аналитики и ML;
  • Управление версионированием схем базы данных, миграции без потери данных;
  • Оптимизация запросов: индексы, первичные ключи, профилирование медленных запросов.

ETL-пайплайны:

  • Разработка и поддержка ETL-пайплайнов на Python (pandas, polars) для всех 12 бизнес-блоков;
  • Оркестрация пайплайнов через Apache Airflow: расписания, зависимости, алерты при падениях;
  • Обработка ошибок, идемпотентность загрузок — данные не должны дублироваться или теряться;
  • Инкрементальная загрузка: только изменившиеся данные, без полной перезаписи;
  • Мониторинг свежести данных: алерт если данные не обновлялись дольше порога.

Парсинг и внешние источники:

  • Мониторинг новых ПД в строительной отрасли;
  • Сбор цен на строительные материалы с сайтов поставщиков для Департамента закупок;
  • Playwright / Scrapy для сайтов с динамическим рендерингом (SPA, JavaScript-сайты);
  • Работа с API: HH.ru, Битрикс24, Telegram Bot API, Perplexity — подключение новых источников по запросу.

Интеграции:

  • REST API интеграции с корпоративными системами: CRM, ERP, HR-система, СОД;
  • Webhooks — приём событий в реальном времени из внешних систем;
  • Разработка и документирование внутренних API для доступа к данным DWH;
  • Управление доступами к данным совместно с MLOps: RBAC на уровне таблиц и схем.

Качество данных:

  • Настройка валидации данных на входе: типы, диапазоны, обязательные поля;
  • Мониторинг аномалий в данных: выбросы, пропуски, несоответствия между источниками;
  • Документирование источников, форматов и логики трансформаций (data lineage);
  • Сверка данных между системами: BI vs БДР — расхождения должны стремиться к нулю.

Документация и процессы:

  • Документирование всех пайплайнов: источник → трансформация → назначение;
  • Runbook'и для команды: как добавить новый источник, как откатить миграцию, что делать при инциденте;
  • Участие в техническом планировании совместно с ML Engineer: какие данные нужны для модели и в каком формате.
Наши ожидания:
  • ClickHouse — продакшн опыт: проектирование схем, оптимизация запросов, партиционирование;
  • Python ETL — pandas, polars: трансформации, очистка, дедупликация данных;
  • Apache Airflow — реальный опыт в проде: DAG'и, операторы, мониторинг задач;
  • SQL продвинутый — оконные функции, CTE, аналитические запросы, оптимизация;
  • REST API интеграции — подключение внешних систем, обработка авторизации (OAuth2, API Key);
  • Scrapy / Playwright — парсинг сайтов, в том числе с динамическим рендерингом;
  • Понимание моделей данных: звезда, снежинка, Data Vault — когда что применять;
  • Linux — администрирование, cron, работа с файловой системой и сетью;
  • Понимание моделей данных: когда нужна нормализация, когда денормализация под аналитику;
  • Понимание 152-ФЗ — какие данные являются ПДн, что нельзя передавать во внешние сервисы;
  • Скорость: ad-hoc аналитический запрос + вывод за 2–4 часа — критично для бизнес-блоков.

Дополнительно:

  • Kafka / RabbitMQ — потоковая обработка событий в реальном времени;
  • dbt — трансформации данных внутри DWH, тестирование моделей;
  • PostgreSQL — опыт как дополнение к ClickHouse для транзакционных данных;
  • Docker — контейнеризация пайплайнов для деплоя через MLOps;
  • Yandex Cloud — Object Storage, Managed ClickHouse, DataLens.

В Dogma Вас ждут:

  • Работа в крупном строительном холдинге федерального уровня;
  • Официальное оформление по ТК РФ с первого рабочего дня (стабильная белая заработная плата с выплатами 2 раза в месяц, оплата больничных листов, ежегодные отпуска);
  • График работы 5/2 с 09.00 до 18.00;
  • Корпоративная программа лояльности для сотрудников Best Benefits – скидки от партнёров;
  • Скидки для сотрудников на приобретение недвижимости компании от 4% до 7%;
  • Всё для эффективной и качественной работы: профессиональная техника, мобильный телефон и корпоративная сотовая связь;
  • Возможность обучения и развития в рамках корпоративного университета компании (тренинги, мастер-классы, онлайн-обучение);
  • Корпоративные подарки детям сотрудников к Новому году и объединяющие корпоративные мероприятия;
  • Корпоративные тренировки по волейболу и футболу;
  • Безграничные возможности кросс-функционального взаимодействия и участия в крупных проектах для расширения профессиональной экспертизы;
  • Отличная команда профессионалов с комфортной и дружелюбной рабочей атмосферой.
Навыки
  • Clickhouse
  • Python ETL
  • Apache Airflow
  • SQL
  • REST API
  • Scrapy
  • Playwright
  • Linux
  • Apache Kafka
  • RabbitMQ
  • dbt
  • PostgreSQL
  • Docker
  • Yandex Cloud
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Rusprofile
  • Москва

  • Не указана

Рекомендуем
Flocktory
  • Москва

  • Не указана

Рекомендуем
Эвокарго

Lead Data Engineer

Эвокарго

  • Москва

  • Не указана

Рекомендуем
Амбрелла
  • Москва

  • Не указана

RWB (Wildberries & Russ)

Senior Data Engineer

RWB (Wildberries & Russ)

  • Москва

  • Не указана

RWB (Wildberries & Russ)

Data Engineer (Лояльность)

RWB (Wildberries & Russ)

  • Москва

  • Не указана

edna
  • Москва

  • Не указана

Островок

Data Engineering Group Lead

Островок

  • Москва

  • Не указана

Завидово Парк

Data Engineer

Завидово Парк

  • Москва

  • Не указана

СБЕР

Data Engineer

СБЕР

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Гоуланг Технологии

Lead Data Engineer

Гоуланг Технологии

  • Москва

  • Не указана

Мокка
  • Москва

  • Не указана

Цифровой аудит

Data Engineer

Цифровой аудит

  • Москва

  • Не указана

Четыре Лапы
  • Москва

  • Не указана

WINLINE
  • Москва

  • Не указана

Компания ПЭК

Senior system analyst

Компания ПЭК

  • Москва

  • Не указана

edna
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию