О проекте
Мы развиваем Фабрику данных — современную платформу для управления корпоративными данными, объединяющую лучшие open-source технологии и собственные решения. Платформа помогает крупным банкам и финансовым компаниям выстраивать Data Lake и витрины данных для аналитики и AI.
Проект включает работу с высоконагруженными потоками, интеграцию разных источников (ERP, API, event-шины), использование технологий Kafka, Spark, Impala, Iceberg. Вся инфраструктура масштабируется в Kubernetes под реальные бизнес-задачи.
На текущем этапе, мы в поисках ведущего разработчика в нашу команду.
Чем предстоит заниматься
- Разрабатывать и поддерживать пайплайны обработки больших данных (batch и streaming);
- Настраивать интеграцию с источниками данных (API, Kafka, JDBC, файловые системы);
- Реализовывать преобразования и обогащение данных с использованием Spark (PySpark);
- Проектировать и оптимизировать структуры хранения (Iceberg, Parquet, S3);
- Работать с SQL-движками (Impala, Trino, PostgreSQL) и управлять витринами данных;
- Внедрять инструменты мониторинга и алертинга качества данных и инфраструктуры;
- Взаимодействовать с командами DevOps, BI и аналитиками.
Наши ожидания
- Аналогичный опыт работы на позиции разработчика от 3 лет;
- Опыт работы с большими объёмами данных и высоконагруженными системами;
- Уверенные знания экосистемы Apache Hadoop (HDFS, Impala, Trino, Hive, Hue);
- Опыт работы с Apache Spark (PySpark, MLlib, Spark SQL);
- Знание форматов хранения Apache Iceberg, Parquet;
- Опыт работы с Kafka (настройка, интеграция);
- Хорошие знания Python, опыт разработки ETL-скриптов и аналитических моделей;
- Уверенное владение SQL (PostgreSQL).
Условия:
-
Полная занятость, график работы 5/2;
- Гибкое начало рабочего дня;
- Оформление по ТК РФ, бессрочный трудовой договор;
- Для городов: Москва, Санкт-Петербург, Ярославль, Чебоксары, Пермь, Воронеж, Самара, Новосибирск, Уфа - гибридный формат работы: по пятницам работа из офиса, остальные дни дистанционно или, по желанию, в офисе;
-
Для городов: Екатеринбург, Волгоград, Калининград, Тула, Казань, Нижний Новгород, Краснодар, Рязань - дистанционный формат работы до тех пор, пока не будет открыт филиал. После открытия филиала занятость сменится на гибридный формат (один день в неделю из офиса).