Обязанности: - Проектирование и развитие ETL / ELT архитектуры;
- Нормализация, дедупликация и корреляция данных;
- Построение streaming pipelines для real-time enrichment и scoring;
- Поддержка Entity Resolution / Identity Resolution;
- Работа с шумными, неполными и противоречивыми данными;
- Реализация replay / backfill без потери консистентности;
Требования: - 6+ лет опыта в Data Engineering;
- Опыт построения production-grade data-платформ;
- Сильные знания SQL и распределённых систем;
Будет большим плюсом ( Graph processing (Neo4j, JanusGraph, Gremlin) ML / scoring pipelines).
Условия: - Английский и Казахский языки: бесплатно и удобно, прямо внутри компании;
- Заботимся о форме и здоровье: компенсируем фитнес и медицинские услуги;
- Мы за активный отдых: футбол, баскетбол, яркие летний и зимний корпоративы;
- Корпоративная библиотека для поиска идей и решения рабочих задач;
- Настольный теннис в офисе для коротких перерывов и заряда энергией.