Data Engineer / Дата инженер (Middle/Senior)

Генотек

Data Engineer / Дата инженер (Middle/Senior)

Москва, Наставнический переулок, 17с1

Метро: Чкаловская

Описание вакансии

Привет! Мы — Genotek, молодая и современная medtech компания. Работаем с технологиями будущего: проводим исследования, которые помогают людям узнать всё про свои гены, происхождение и особенности здоровья.

Сейчас мы находимся в поиске опытного инженера данных, который возьмет на себя разработку и внедрение масштабируемой системы обработки событий (event processing pipeline). Вам предстоит построить отказоустойчивую платформу для сбора, трансформации и анализа данных.

Чем предстоит заниматься:

  • Мониторинг, оптимизация и масштабирование баз данных (MySQL, ClickHouse): анализ медленных запросов, настройка индексов, планирование и реализация партиционирования и шардинга.

  • Полный цикл разработки витрин данных: от проектирования и рефакторинга существующих до создания новых. Очистка сырых данных, дедубликация, оптимизация ETL-процессов.

  • Интеграция данных из внешних источников (Яндекс.Метрика, Roistat и др.) через API: обеспечение отказоустойчивости, обработка ошибок, retry-логика, валидация и обеспечение качества и полноты данных.

  • Разработка, поддержка и оптимизация сложных данных пайплайнов в Apache Airflow (создание новых DAG).

  • Подготовка и поддержание актуальной технической документации: схемы данных, дата-словари, описание витрин и ETL-процессов.

  • Участие в процессе разработки: code review, работа по Git Flow, внедрение и соблюдение стандартов кодирования.

Что мы ожидаем от вас:
  • Опыт коммерческой разработки в роли Data Engineer от 3-х лет (для Middle) и от 5-ти лет (для Senior).

  • Продвинутый SQL: глубокое понимание и большой опыт написания и оптимизации сложных запросов.

  • Опыт работы с СУБД:

    • MySQL: знания по оптимизации производительности (индексы, анализ execution plan).

    • ClickHouse: понимание специфики column-oriented БД

  • Сильный Python для ETL: опыт написания надежного и эффективного кода для данных пайплайнов (библиотеки: pandas, SQLAlchemy, requests и т.д.).

  • Глубокое знание Apache Airflow: опыт создания сложных, отказоустойчивых и идемпотентных DAG, использование сенсоров, хуков, XCom.

  • Опыт построения и поддержки DWH/витрин данных: понимание принципов dimensional modeling (звезда, снежинка), типов таблиц (факты, измерения).

  • Навыки работы с API: опыт интеграции с различными REST API (пагинация, ограничения, обработка ошибок, retry-механизмы).

  • Приверженность best practices: уверенная работа с Git (Git Flow), обязательный опыт проведения code review, понимание принципов CI/CD

  • Высшее профильное образование.

Будет плюсом:
  • Опыт построения инфраструктуры данных с нуля (greenfield project).

  • Знание концепций и инструментов обеспечения Data Quality (валидация, мониторинг аномалий).

  • Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes).

  • Базовое понимание WEB-технологий (React/Angular) на уровне, достаточном для взаимодействия с фронтенд-разработчиками.

  • Знание облачных платформ (Yandex Cloud, AWS) и их сервисов для данных.

Что мы предлагаем:

  • Оформление по ТК РФ и его полное соблюдение (оплачиваемые отпуска, больничные), бонусы работы в аккредитованной IT-компании;

  • Формат работы: удалённый, но при желании можно ходить в офис в Москве или в Питере (в Питере можно ходить в офис в ИТМО или на Пионерской)

  • ДМС, занятия английским в Skyeng, психологические консультации от сервиса Youtalk и Генетический паспорт Genotek для всех сотрудников;

  • Дружную команду и уважительное отношение к инициативе

Пришли нам сопроводительное письмо, в котором расскажешь про свой самый сложный проект на Python.

Посмотреть контакты работодателя

Адрес

Похожие вакансии

МегаФон
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Инвиста

Data Engineer (relocate)

Инвиста

Удаленная работа
  • Москва

  • до 6000 USD

Рекомендуем
SSP SOFT

Data Engineer

SSP SOFT

Удаленная работа
  • Москва

  • до 6000 USD

Рекомендуем
ARK
Удаленная работа
  • Москва

  • до 6000 USD

Бэнкс Софт Системс

Data Engineer

Бэнкс Софт Системс

Удаленная работа
  • Москва

  • до 6000 USD

Островок

Senior ETL/DWH Developer

Островок

Удаленная работа
  • Москва

  • до 6000 USD

Skillbox

Data Engineer

Skillbox

Удаленная работа
  • Москва

  • до 6000 USD

Data Engineer

Кидс Аппс

Удаленная работа
  • Москва

  • до 6000 USD

Flowwow
Удаленная работа
  • Москва

  • от 270000 RUR

USETECH
Удаленная работа
  • Москва

  • от 270000 RUR

ГК Орбита

Data Engineer Senior

ГК Орбита

Удаленная работа
  • Москва

  • от 270000 RUR

Bell Integrator

Data Engineer/ Senior

Bell Integrator

Удаленная работа
  • Москва

  • от 270000 RUR

Концепт Разработка

Разработчик DWH/Data Engineer

Концепт Разработка

Удаленная работа
  • Москва

  • от 270000 RUR

М.Видео-Эльдорадо

Data Engineer

М.Видео-Эльдорадо

Удаленная работа
  • Москва

  • от 270000 RUR

Дата Дженерейшн

Data Engineer

Дата Дженерейшн

Удаленная работа
  • Москва

  • до 340000 RUR

Национальная Лотерея

Инженер данных

Национальная Лотерея

Удаленная работа
  • Москва

  • до 340000 RUR

Мокка
Удаленная работа
  • Москва

  • до 340000 RUR

Rubbles
Удаленная работа
  • Москва

  • до 400000 RUR

Leads
Удаленная работа
  • Москва

  • до 240000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию