Senior Data Engineer

Emphasoft

Senior Data Engineer

Описание вакансии

О проекте

Ищем Senior Data Engineer в команду разработки платформы больших данных. Роль предполагает участие в создании и развитии интеграционных потоков, построении data lakehouse решений и разработке высоконагруженных потоков обработки данных.

Наш стек

Greenplum, Trino, Apache Airflow, ClickHouse, Python, Spark, SQL (dbt), S3, Hadoop, Iceberg, Kafka, Flink, Cosmos.

Обязанности

- Разработка, реализация и поддержка интеграционных потоков, а также потоков сборки витрин-данных на стеке технологий, принятых в команде: Trino, Iceberg, S3, Spark, Apache Airflow, Kafka, Cosmos, Flink
- Разработка нетиповых интеграций (в тч SAP)
- Системная разработка инструментов (переиспользуемых шаблонов) обработки данных
- Разработка системного дизайна сложных решений (C2/DD)
- Оперативное реагирование на информацию о проблемах в зоне ответственности, выполнение типовых задач в установленный срок
- Поддержание в актуальном состоянии документации типовых интеграционных решений платформы больших данных. Предоставление отчетности о своей деятельности руководителю.

Требования

- Общее представление о стеке технологий Lakehouse
- Понимание различия работы между BigData/Lakehouse и с данными обычного размера
- Знание SQL (индексы, функции, оптимизация, профилирование производительности
- Знание языков программирования (JAVA, Python)
- Опыт работы c реляционными БД (Oracle, Postgres, MySQL, MsSQL,т.п.)
- Умение работать с Git (знание команд git pull/commit/push)
- Опыт работы с DBT, Cosmos, Ni-Fi
- Опыт разработки на Spark
- Навыки использования компонентов экосистемы Hadoop: Yarn, Ranger, Zookeeper, Hive metastore
- Понимание особенностей Trino
- Понимание форматов данных Iceberg, Parquet, Avro
- Понимание работы с minio или любого другого хранилища на основе S3
- Опыт использования системами ведения проектов и документации
- Опыт разработки нетиповых интеграций (включая SAP-системы)
- Опыт разработки near-realtime потоков (Flink, Debezium)
- Опыт оптимизации высоконагруженных потоков (миллиарды записей инкремента) с использованием инструментов Observability (grafana, victoria metrics, zabbix)

Условия:

  • B2B Контракт, ИП.
  • Гибкий график
  • Корпоративные курсы английского
  • 3 оплачиваемых sick day в год
  • Профессиональный рост и развитие в сильной команде

  • Современный стек и выстроенные процессы

  • Долгосрочное сотрудничество

Посмотреть контакты работодателя

Похожие вакансии

Emphasoft
  • Санкт-Петербург

  • Не указана

Рекомендуем
RedLab
  • Санкт-Петербург

  • Не указана

Рекомендуем
RedLab
  • Санкт-Петербург

  • до 370000 RUR

Рекомендуем
АЛРОСА
  • Санкт-Петербург

  • до 370000 RUR

RedLab
  • Санкт-Петербург

  • до 450000 RUR

ЕДИНЫЙ ЦУПИС

AI-инженер

ЕДИНЫЙ ЦУПИС

  • Санкт-Петербург

  • до 450000 RUR

iFuture
  • Санкт-Петербург

  • до 450000 RUR

RedLab
  • Санкт-Петербург

  • до 300000 RUR

Яндекс
  • Санкт-Петербург

  • до 300000 RUR

Bercut
  • Санкт-Петербург

  • до 300000 RUR

RedLab
  • Санкт-Петербург

  • до 600000 RUR

Siberian Wellness
  • Санкт-Петербург

  • до 600000 RUR

Lindaily
  • Санкт-Петербург

  • до 600000 RUR

  • Санкт-Петербург

  • до 600000 RUR

ТаймВэб
  • Санкт-Петербург

  • до 600000 RUR

RedLab
  • Санкт-Петербург

  • от 260000 RUR

Сократика
  • Санкт-Петербург

  • от 260000 RUR

Haulmont
  • Санкт-Петербург

  • до 200000 RUR

Haulmont
  • Санкт-Петербург

  • до 200000 RUR

KASSIR.RU
  • Санкт-Петербург

  • до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию