Дата инженер

2ГИС

Дата инженер

Описание вакансии

Мы строим корпоративную дата-платформу следующего уровня. Это новый сервис с амбициозной задачей: трансформировать наработки компании в единое стандартизированное решение для работы с данными. Отказываемся от легаси, проектируем архитектуру заново, сохраняем лучшее (например, Apache Spark), и постепенно переносим существующие пайплайны на новую платформу.

С нуля — это не «начать с чистого листа», это возможность заложить фундамент, который будет надёжным, масштабируемым и понятным десяткам инженерных команд. Именно сейчас мы переопределяем техстек, архитектурные подходы, процессы. И именно сейчас у тебя есть шанс поучаствовать в запуске платформы, куда будут стекаться все корпоративные данные.

Что предстоит делать:

  • Разрабатывать с нуля MVP новой дата-платформы и инфраструктуры для ingest/transform;
  • Мигрировать существующие пайплайны с Hadoop/HDFS на новую архитектуру (S3, Kafka, Spark, ClickHouse);
  • Работать с большими объёмами данных и высоконагруженными Kafka-топиками;
  • Строить отказоустойчивые пайплайны обработки и доставки данных;
  • Участвовать в архитектурных решениях, внедрять best practices хранения, мониторинга и качества данных;
  • Проектировать витрины данных под продуктовую и управленческую аналитику (OLAP);
  • Сопровождать миграцию BI-отчётов на новую платформу (например, DataLens, Power BI).

Почему это интересно:

  • Ты действительно будешь создавать платформу с нуля — не “настроил Airflow и готово”, а архитектура верхнего уровня с безопасностью, мониторингом и многопользовательской нагрузкой;
  • Прямое влияние на технологический курс всей компании: твои решения будут использовать десятки команд;
  • Работа с современным стеком: Spark 3+, Kafka, S3, ClickHouse, и BI-инструментами;
  • Возможность реализовать техрешения, которые трудно было бы внедрить в рамках существующего кода/подходов;
  • Технический вызов: миграция с Hadoop, масштабируемость, отказоустойчивость, строгие SLA на доставку данных.

Мы будем рады специалисту, который:

  • Имеет 5+ лет опыта на позиции Data Engineer / Big Data Engineer;
  • Отлично понимает, как работает Spark и умеет его готовить (RDD/DataFrames, Partitioning, Tuning);
  • Имеет опыт работы с высоконагруженной Kafka (десятки/сотни тысяч событий, масштабируемость, latency);
  • Работал с ClickHouse и знает, как «выжать» из него максимум;
  • Знаком с построением дата-архитектуры (DWH, OLAP, ETL/ELT, чанки, шардирование, SLA);
  • Умеет проектировать пайплайны под отказоустойчивость, traceability и продакшеновую эксплуатацию;
  • Пишет на одном из языков программирования, например, Scala
  • Знает SQL и может читать логику отчетов без боли;
  • Понимает, как работать с облачными хранилищами и строить отказоустойчивую delivery (AWS S3 - плюс).

Плюсом будут:

  • Опыт построения дата-платформ и миграции данных между системами / подходами;
  • Знание инструментов мониторинга и автоматического контроля качества данных (data contracts);
  • Опыт настройки OpenMetadata / DataHub, реализации практик Data Governance;
  • Опыт с Trino, Presto, dbt;
  • Инфраструктурный опыт: Docker, Kubernetes, CI/CD.

Как мы работаем:

  • Не боимся убирать легаси — мы осознанно избавляемся от устаревших решений;
  • Оцениваем эффективность не по объёму кода, а по бизнес-ценности;
  • Любим, когда инженер предлагает нестандартные, но обоснованные решения;
  • Верим, что архитектура важна, если её понимают (human-friendly документация — мастхэв);
  • Умеем договариваться — и с бизнесом, и между собой.

Что мы предлагаем:

  • 2ГИС — аккредитованная IT-компания;
  • У нас можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, у нас есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске;
  • Само собой, полностью белая зарплата. Дополнительные дни отпуска за стаж работы в компании;
  • Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента;
  • Если хочешь делиться своим опытом, мы только за — поможем с выступлениями на конференциях и статьями для Хабра;
  • Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.

Навыки
  • Spark
  • Hadoop
  • Apache Kafka
  • Clickhouse
  • Английский язык
Посмотреть контакты работодателя

Похожие вакансии

2ГИС
Удаленная работа
  • Новосибирск

  • Не указана

Рекомендуем
СДЭК
Удаленная работа
  • Новосибирск

  • Не указана

Рекомендуем
ВанТуВорк

Promt-инженер

ВанТуВорк

Удаленная работа
  • Новосибирск

  • Не указана

Рекомендуем
Линсофтверпродакшн

Middle+ / Senior ML-инженер

Линсофтверпродакшн

Удаленная работа
  • Новосибирск

  • до 330000 RUR

Voice AI-инженер

Гринченко Виктор Алексеевич

Удаленная работа
  • Новосибирск

  • до 330000 RUR

билайн
Удаленная работа
  • Новосибирск

  • до 330000 RUR

Удаленная работа
  • Новосибирск

  • от 100000 RUR

Вкусная Франшиза
Удаленная работа
  • Новосибирск

  • от 100000 RUR

WILDBERRIES

DevOps-инженер

WILDBERRIES

Удаленная работа
  • Новосибирск

  • от 100000 RUR

ВентФасад Проект
Удаленная работа
  • Новосибирск

  • от 150000 RUR

Провенто, ГК
Удаленная работа
  • Новосибирск

  • от 140000 RUR

МКК СМСФИНАНС
Удаленная работа
  • Новосибирск

  • до 200000 RUR

АкваБайт
Удаленная работа
  • Новосибирск

  • до 120000 RUR

Т1
Удаленная работа
  • Новосибирск

  • до 120000 RUR

Доза, НПП
Удаленная работа
  • Новосибирск

  • до 120000 RUR

ГРУППА КОМПАНИЙ ЭКОНИВА
Удаленная работа
  • Новосибирск

  • до 120000 RUR

Т1
Удаленная работа
  • Новосибирск

  • до 120000 RUR

Авантелеком
Удаленная работа
  • Новосибирск

  • до 120000 RUR

Технология
Удаленная работа
  • Новосибирск

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию