Роль: Построить и развивать контур хранения, загрузки, предобработки и выдачи данных с опорой на ClickHouse как ядро.
📌 Почему к нам
• Передовые CV/DS/GenAI + real-time задачи • Прямое влияние на игру и решения штаба • Рост и ответственность: от прототипа до продакшена
Обязанности
Задачи:
- Спроектировать модели данных под ClickHouse: MergeTree/Replicated*, ключи сортировки, партиционирование, TTL (hot/cold).
- Настроить устойчивый ingest: батчи и стрим (Nats), дедупликация, upsert-стратегии, идемпотентность.
- Реализовать предобработку: сглаживание временных рядов, фильтрация выбросов/аномалий, нормализация координат и временных меток.
- Обеспечить быстрые выборки и выдачу: агрегаты по окнам, rollup-слои, служебные словари, API/выгрузки для продуктовых и ML-сервисов.
- Управление качеством: валидаторы схем и правил, контроль полноты/задержек, линейдж и аудит изменений.
- Безопасность и доступы: RBAC, маскирование, разграничение по ролям и командам.
- Документация контура данных и регламентов эксплуатации.
- Взаимодействие с командами разработки и System Analyst.
Требования
- Высшее образование
- Опыт работы 3+ года в Data Engineering
- Опыт проектирования высоконагруженных колоночных DWH
- Глубокое понимание ClickHouse
- Умение строить конвейеры загрузки/выгрузки и обеспечивать идемпотентность - Практики предобработки данных: сглаживание (скользящее/экспоненциальное), обработка пропусков, детекция выбросов
- Уверенный SQL, оптимизация запросов, профилирование планов.
Условия
- срочный трудовой договор до 30.12.2025 (с возможностью продления на 2026 год)
- ДМС
- возможна удаленная работа по РФ(но процедура оформления проходит в Москве)
- Возможность работы на 0,5 ставки
- Проект с партнерством ПФК ЦСКА