Junior Data Engineer

Lamoda Tech

Junior Data Engineer

Описание вакансии

Мы в поиске младшего Инженера по работе с большими данными в направление дата инжиниринга, который будет участвовать в значимых для инфраструктуры данных в Lamoda проектах.

Чем предстоит заниматься:

  • Проектировать и разрабатывать ETL пайплайны данных на Airflow для Spark, Streaming, Hive, Trino et;

  • Оптимизировать действующие пайплайны в продуктах на основе платформ данных;

  • Настраивать интеграции с новыми источниками данных (Kafka, Postgres, S3, HDFS, Aerospike);

  • Работать в команде с аналитиками и ML специалистами для создания/развертывания инструментов и наборов данных, соответствующих их требованиям;

  • Изучать бизнес процессы, которые стоят за данными и исходя из них выстраивать логику обработки данных;

  • Мониторить нагрузку на кластер и оптимальность затрачиваемых приложениями ресурсов;

  • Обеспечивать качество данных в разных системах, адаптировать платформу Data Quality под нужды пользователей и поставщиков данных.

Мы ожидаем:

  • Уверенное знание одного из языков программирования: Python, Java, Scala;

  • Знание основных структур данных;

  • Умение работать с Git и Gitlab/Github/Bitbucket, понимание что такое CI/CD;

  • Уверенное знание SQL (умение написать сложный запрос и оптимизировать его);

  • Знание основ Big Data:

    • понимание концепции распределенных вычислений;

    • понимание как работают различные файловые форматы;

    • понимание различий баз данных (Postgres, Clickhouse, Redis);

    • понимание подходов к обработке данных (streaming, batch);

  • Опыт работы с Hadoop, Spark, Hive, Airflow;

  • Знание английского языка достаточные для чтения технической документации.

Будет плюсом:

  • Знание основных методологий разработки;

  • Понимание основ Docker и зачем он нужен;

  • Опыт реализации пайплайнов и витрин данных в продукте: работа с различными источниками и типами данных (Hive, S3, Kafka, Postgres, Redis);

  • Опыт или понимание основ оптимизации Spark приложений или SQL запросов;

  • Опыт изучения бизнес-процессов, которые стоят за данными, опыт выстраивания логики обработки данных.

Навыки
  • Python
  • SQL
  • Java
  • SCALA
  • Big Data
  • Airflow
Посмотреть контакты работодателя

Похожие вакансии

АО «ОТП Банк» (JSC «OTP Bank»)

Data engineer (Трайб Data office)

АО «ОТП Банк» (JSC «OTP Bank»)

Гибкий график
  • Москва

  • Не указана

Рекомендуем
Группа компаний Астра
Гибкий график
  • Москва

  • Не указана

Рекомендуем
ПСБ (ПАО «Промсвязьбанк»)

Администратор OpenSource (junior)

ПСБ (ПАО «Промсвязьбанк»)

Гибкий график
  • Москва

  • Не указана

Рекомендуем
Яндекс Практикум
Гибкий график
  • Москва

  • Не указана

Яндекс
Гибкий график
  • Москва

  • Не указана

Gridnine Systems
Гибкий график
  • Москва

  • Не указана

VSEMAYKI.RU

Data Engineer

VSEMAYKI.RU

Гибкий график
  • Москва

  • Не указана

Сикрет Технолоджис
Гибкий график
  • Москва

  • Не указана

WILDBERRIES
Гибкий график
  • Москва

  • Не указана

Райффайзен Банк

Стажер Data Steward

Райффайзен Банк

Гибкий график
  • Москва

  • Не указана

Цифровые решения, НПП

Инженер-разработчик RTL

Цифровые решения, НПП

Гибкий график
  • Москва

  • от 150000 RUR

RUTUBE
Гибкий график
  • Москва

  • от 150000 RUR

White Light
Гибкий график
  • Москва

  • до 80000 RUR

Спортлевел

Сетевой инженер

Спортлевел

Гибкий график
  • Москва

  • до 80000 RUR

Акметрон
Гибкий график
  • Москва

  • от 150000 RUR

Tele2
Гибкий график
  • Москва

  • от 150000 RUR

Tele2
Гибкий график
  • Москва

  • от 150000 RUR

INSITECH Development

DevOps Engineer

INSITECH Development

Гибкий график
  • Москва

  • от 150000 RUR

Геомер Групп
Гибкий график
  • Москва

  • до 120000 RUR

Межрегиональный ТранзитТелеком (АО МТТ)

Ведущий инженер отдела сервисных платформ

Межрегиональный ТранзитТелеком (АО МТТ)

Гибкий график
  • Москва

  • до 120000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию