Алматы, улица Каныша Сатпаева, 29Д
Метро: АлатауМы Kaspi.kz - крупнейшая технологическая компания в Казахстане, миссия которой - улучшать людям жизнь. Ежемесячно нашим супер приложением пользуются более 14 млн казахстанцев.
В команду Computer Vision нужен Data analyst.
Вам предстоит:
* Формулировать и решать прикладные задачи на табличных данных
* Извлекать признаки из неструктурированных и событийных данных (в т.ч. JSON, логов, временных рядов)
* Проводить исследовательский анализ, находить устойчивые зависимости и проверять гипотезы о поведении объектов
* Обучать и валидировать ML-модели (основной стек - градиентные бустинги)
* Проектировать стековые признаки, создавать агрегаты, лаги, rolling-метрики и пр.
* Развивать внутреннюю инфраструктуру - от подготовки данных до автоматизации пайплайнов
* Участвовать в разработке библиотек и шаблонов для фичей, метрик и моделей
Требования:
* Знание SQL и опыт интеграции с аналитическими БД (Postgres, Starrocks и т.п.)
* Уверенные знания Python и библиотек для анализа данных (pandas, numpy, scikit-learn и др.)
* Хорошее знание и понимание Excel
* Глубокое понимание работы с табличными моделями (бустинговые модели, временные ряды и т.п.)
* Опыт извлечения и трансформации данных из вложенных структур (например, JSON)
* Навыки проектирования признаков и понимание их влияния на модель
* Понимание принципов построения устойчивых и воспроизводимых аналитических решений
* Аккуратность в работе с кодом и внимательность к деталям
Будет плюсом:
* Опыт в построении и поддержке аналитических пайплайнов (Airflow или прочие интсрументы окрестрации)
* Знание подходов к организации слоёв данных
* Опыт построения собственных пайплайнов из "сырого" JSON в продакшн-фреймы
* Навыки контейнеризации, скриптов и CLI-инструментов (Docker, argparse и пр.)
* Участие в ML/DS-проектах с end-to-end ответственностью: от данных до внедрения
* Владение английским на уровне чтения технической документации и работы с научными статьями