Ведущий разработчик (Фабрика данных)

Diasoft

Ведущий разработчик (Фабрика данных)

Описание вакансии

О проекте
Мы развиваем Фабрику данных — современную платформу для управления корпоративными данными, объединяющую лучшие open-source технологии и собственные решения. Платформа помогает крупным банкам и финансовым компаниям выстраивать Data Lake и витрины данных для аналитики и AI.
Проект включает работу с высоконагруженными потоками, интеграцию разных источников (ERP, API, event-шины), использование технологий Kafka, Spark, Impala, Iceberg. Вся инфраструктура масштабируется в Kubernetes под реальные бизнес-задачи.
На текущем этапе, мы в поисках ведущего разработчика в нашу команду.

Чем предстоит заниматься

  • Разрабатывать и поддерживать пайплайны обработки больших данных (batch и streaming);
  • Настраивать интеграцию с источниками данных (API, Kafka, JDBC, файловые системы);
  • Реализовывать преобразования и обогащение данных с использованием Spark (PySpark);
  • Проектировать и оптимизировать структуры хранения (Iceberg, Parquet, S3);
  • Работать с SQL-движками (Impala, Trino, PostgreSQL) и управлять витринами данных;
  • Внедрять инструменты мониторинга и алертинга качества данных и инфраструктуры;
  • Взаимодействовать с командами DevOps, BI и аналитиками.

Наши ожидания

  • Аналогичный опыт работы на позиции разработчика от 3 лет;
  • Опыт работы с большими объёмами данных и высоконагруженными системами;
  • Уверенные знания экосистемы Apache Hadoop (HDFS, Impala, Trino, Hive, Hue);
  • Опыт работы с Apache Spark (PySpark, MLlib, Spark SQL);
  • Знание форматов хранения Apache Iceberg, Parquet;
  • Опыт работы с Kafka (настройка, интеграция);
  • Хорошие знания Python, опыт разработки ETL-скриптов и аналитических моделей;
  • Уверенное владение SQL (PostgreSQL).

Условия:

  • Полная занятость, график работы 5/2;

  • Гибкое начало рабочего дня;
  • Оформление по ТК РФ, бессрочный трудовой договор;
  • Для городов: Москва, Санкт-Петербург, Ярославль, Чебоксары, Пермь, Воронеж, Самара, Новосибирск, Уфа - гибридный формат работы: по пятницам работа из офиса, остальные дни дистанционно или, по желанию, в офисе;
  • Для городов: Екатеринбург, Волгоград, Калининград, Тула, Казань, Нижний Новгород, Краснодар, Рязань - дистанционный формат работы до тех пор, пока не будет открыт филиал. После открытия филиала занятость сменится на гибридный формат (один день в неделю из офиса).

Навыки
  • Python
  • Apache Spark
  • Apache Kafka
Посмотреть контакты работодателя

Похожие вакансии

HuntIT
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Developer ETL / DWH (Lead or Senior)

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Absolut POS
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Криптонит

Data Engineer (Senior/Middle)

Криптонит

Полный день
  • Москва

  • Не указана

Делимобиль

Data Engineer (middle, senior)

Делимобиль

Удаленная работа
  • Москва

  • Не указана

Криптонит

Lead/Senior Data Analyst

Криптонит

Полный день
  • Москва

  • Не указана

Банк ДОМ.РФ
Удаленная работа
  • Москва

  • Не указана

БЮРО 1440
Удаленная работа
  • Москва

  • Не указана

SkillStaff
Удаленная работа
  • Москва

  • Не указана

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Senior/Lead Data Analyst (Геоаналитика)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • Не указана

Криптонит
Полный день
  • Москва

  • Не указана

Криптонит

Tech Lead Data Engineering

Криптонит

Полный день
  • Москва

  • Не указана

WINLINE
Полный день
  • Москва

  • Не указана

НОВАТЭК
Полный день
  • Москва

  • Не указана

ДипХакЛаб

Senior Scala Backend Developer

ДипХакЛаб

Удаленная работа
  • Москва

  • до 550000 RUR

Лига Цифровой Экономики

Разработчик DWH

Лига Цифровой Экономики

Полный день
  • Москва

  • до 550000 RUR

Страховая компания Сбербанк страхование

Lead /Senior Data Scientist

Страховая компания Сбербанк страхование

Полный день
  • Москва

  • до 550000 RUR

Лига Цифровой Экономики

Разработчик базы данных

Лига Цифровой Экономики

Полный день
  • Москва

  • до 550000 RUR

СБЕР
Полный день
  • Москва

  • до 550000 RUR

МТС
Удаленная работа
  • Москва

  • до 550000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию