Ведущий data-инженер

Центр Биометрических Технологий

Ведущий data-инженер

Москва, Овчинниковская набережная, 18/1с2

Метро: Новокузнецкая

Описание вакансии

Ищем опытного Senior Data Engineer для ключевой роли в проекте по построению корпоративного Lakehouse — новой платформы хранения и обработки данных. Вам предстоит ключевое участие в миграции с legacy-систем на Hadoop к современному стеку на базе S3 и StarRocks/Doris и выстраивать надежные, масштабируемые ETL-процессы.

Основные задачи

  • участие в проектировании и практическая реализация нового корпоративного on-premise Lakehouse-хранилища на стеке S3-совместимое хранилище + StarRocks/Doris;
  • настройка сквозных ETL/ELT-процессов для загрузки данных из Hadoop/Hive, Kafka, PostgreSQL и их трансформации по многослойной модели (raw → агрегаты → витрины);
  • миграция данных из действующей систем Hadoop (HDFS, Hive), PostgreSQL) на новую платформу;
  • разработка, оптимизация и поддержка высокопроизводительных витрин данных в StarRocks/Doris для аналитики и отчетности;
  • настройка базовых механизмов мониторинга качества данных (Data Quality) в пайплайнах;
  • проектирование модели хранения и ролевой модели доступа;
  • взаимодействие с аналитиками и бизнес-заказчиками для уточнения требований к витринам;
  • документирование архитектурных решений и наставничество команды.

Наши ожидания

  • от 5 лет опыта в Data Engineering, проектирование и поддержку процессов загрузки и преобразования данных;
  • экспертный уровень владения SQL (сложные запросы и оптимизация);
  • практический опыт миграции на on-premise S3 (MinIO, Ozone, Ceph);
  • глубокий опыт работы с высоконагруженными и колоночными OLAP-системами (StarRocks, Doris, ClickHouse или аналогами);
  • промышленный опыт построения ETL/ELT-пайплайнов с использованием Apache Spark (Scala)/NiFi/AirFlow/Informatica PC или аналогами;
  • опыт работы с контейнерами (Docker) и оркестрацией в on-premise Kubernetes/OpenShift;
  • понимание экосистемы Big Data (Hadoop, Kafka, Spark) и принципов работы с реляционными СУБД (PostgreSQL);
  • опыт работы с форматами данных (Parquet, Avro) и понимание принципов организации данных в Lakehouse (Iceberg/Delta/Hudi) будет большим плюсом;
  • системное и архитектурное мышление, готовность брать ответственность за комплексные решения и результат;
  • опыт работы с Jira и Confluence.

Условия:

  • официальный доход - оклад + бонус квартальный и годовой; условия с успешным кандидатом готовы обсуждать индивидуально;
  • ДМС со стоматологией и международная страховка;
  • кафетерий льгот (компенсация ОСАГО, спортивного инвентаря, ДМС близким родственникам и многое другое);
  • гибридный график работы;
  • офис находится в центре в шаговой доступности от ст. м. Новокузнецкая;
  • заряженная команда полного цикла;
  • возможность профессионального и карьерного роста.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Flocktory
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
Т-Банк

Data Engineer

Т-Банк

Полный день
  • Москва

  • Не указана

Рекомендуем
Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Senior ETL developer (Tech Lead)

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Удаленная работа
  • Москва

  • Не указана

Т-Банк

Lead Data Engineer

Т-Банк

Удаленная работа
  • Москва

  • Не указана

Т-Банк
Полный день
  • Москва

  • Не указана

BORK
Полный день
  • Москва

  • Не указана

Банк ВТБ (ПАО)
Полный день
  • Москва

  • Не указана

Employcity
Удаленная работа
  • Москва

  • Не указана

ARK
Полный день
  • Москва

  • Не указана

Полный день
  • Москва

  • Не указана

BostonGene Technologies

Lead AI Engineer (to Yerevan)

BostonGene Technologies

Полный день
  • Москва

  • Не указана

IBS
Полный день
  • Москва

  • Не указана

Платформа Больших Данных

Старший аналитик данных

Платформа Больших Данных

Полный день
  • Москва

  • Не указана

585, Холдинг

AI Lead

585, Холдинг

Полный день
  • Москва

  • Не указана

Полный день
  • Москва

  • Не указана

Марс

Tech lead

Марс

Полный день
  • Москва

  • Не указана

2ГИС
Удаленная работа
  • Москва

  • Не указана

СБЕР
Удаленная работа
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию