Data engineer / Инженер данных (Middle+)

Riverstart (ООО Риверстарт)

Data engineer / Инженер данных (Middle+)

Москва

Метро: Библиотека им.Ленина

Описание вакансии

IT-компания Riverstart. С 2012 года трансформируем сложные идеи в удобные сервисы для бизнеса. Входим в реестр МТК, аккредитованы в Минцифры.

Работаем с государством и бизнесом.
Создаем высоконагруженные сервисы для веба и мобайла: сайты, порталы, сервисы, веб-платформы, мобильные приложения, CRM, LMS и ERP-системы.

Входим в топ-20 разработчиков сложных проектов в России и занимаем первую строку в рейтинге агентств по поддержке и развитию сайтов (Рейтинг Рунета 2025).

Получили 40 призовых наград в федеральных и международных IT-конкурсах.

Ищем Инженера данных уровня middle+ и выше.

Задачи:

  • Разработка, оптимизация и поддержка ETL/ELT-процессов;
  • Проектирование и рефакторинг моделей данных с учётом масштабируемости;
  • Обеспечение качества данных (валидация, тестирование целостности);
  • Автоматизация процессов загрузки и трансформации;
  • Мониторинг и оперативное решение инцидентов в продакшене;
  • Интеграция с источниками и целевыми системами хранения;
  • Подготовка технической документации и схем данных.

Требования:

  • Возможность работать по часовому поясу мск;
  • Опыт работы в области DWH/Data engineering от 3х лет - ВАЖНО!
  • Уверенное владение SQL: оптимизация запросов, оконные функции, CTE, работа с большими объёмами данных;
  • Практический опыт с Python для обработки данных и трансформаций;
  • Опыт разработки и сопровождения ETL/ELT-процессов в продуктивной среде;
  • Работа с распределёнными системами: Hadoop (HDFS, Hive, Spark), Greenplum, ClickHouse;
  • Понимание архитектуры хранилищ данных (DWH, Data Lake, Lakehouse);
  • Работа с реляционными СУБД (PostgreSQL, MSSQL);
  • Использование систем контроля версий (Git);
  • Опыт оркестрации пайплайнов (предпочтительно Apache Airflow: DAG, мониторинг, управление зависимостями);
  • Понимание принципов работы с распределёнными системами хранения;
  • Анализ источников данных и проектирование моделей данных под аналитические задачи;
  • Документирование процессов, моделей и трансформаций;
  • Взаимодействие с кросс-функциональными командами (разработчики, аналитики, бизнес);
  • Анализ и устранение инцидентов в продуктивной среде.
Условия:
  • Оформление по ТК РФ или ИП;
  • Возможность работать удалённо или в офисе;
  • Разнообразные проекты.
Навыки
  • Python
  • Clickhouse
  • SQL
  • ETL
  • Hadoop
  • Greenplum
  • PostgreSQL
  • Git
  • Apache Airflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию