Ташкент, улица Нукус, 29А
Команда AVO создает новый технологичный розничный банк на рынке Узбекистана. Основная концепция сервиса - клиент самостоятельно может получить все услуги банка через мобильное приложение и устройства самообслуживания.
Наш сегодняшний вызов - создать самый продвинутый digital банк в Узбекистане. Мы ищем Дата-сайентиста (Data Scientist).
Фичи и Feature Platform: проектировать, разрабатывать и валидировать признаки; обеспечивать их корректную доступность в обучении и на инференсе (offline/online), поддерживать документацию и жизненный цикл фичей.
Качество фичей: оценивать значимость, устойчивость и влияние признаков (статистика, leakage, drift), оптимизировать существующие и добавлять новые.
Модели end-to-end: разрабатывать и улучшать ML-модели, проводить эксперименты, валидацию и интерпретацию результатов.
Шипмент в прод: доводить решение до production-уровня совместно с ML/Engineering: пайплайны, CI/CD, MLOps, мониторинг качества и данных после релиза.
Feature Platform / Feature Engineering
Понимание, что такое фича в продуктовой и технической логике: определение, окно агрегации, гранулярность, entity key, правила обновления, offline/online.
Умение разрабатывать фичи в платформе/feature store (Feast или аналог): источники данных, материализация, контроль качества, версионирование и повторяемость расчётов.
Знание типовых рисков: data leakage, смещение, дубли, несогласованность ключей, временные сдвиги, корректная работа с time-aware данными.
Моделирование
Уверенное построение ML-моделей на табличных данных: постановка задачи, разметка таргета, валидация (CV/Time-split), подбор метрик, тюнинг.
Умение объяснять вклад факторов и принимать решения по фичам/модели на основе данных (importance, SHAP/аналоги, ablation, стабильность по сегментам)
Технический стек: Python + SQL + DWH
Сильный Python для продакшн-кода: pandas/NumPy, sklearn, CatBoost/LightGBM (или аналоги), аккуратная структура проекта, тестируемость.
Сильный SQL: сложные join’ы, оконные функции, агрегации, оптимизация запросов; уверенная работа с DWH (Greenplum/PostgreSQL).
Понимание, как строить воспроизводимые датасеты и расчёты на больших данных (производительность, профилирование, контроль ресурсов).
Production mindset: CI/CD и MLOps
Понимание полного ML-цикла: подготовка данных → обучение → артефакты → деплой → инференс → мониторинг.
Опыт/понимание: Git, CI/CD, контейнеризация (Docker), трекинг экспериментов/артефактов (MLflow или аналог), базовый мониторинг (качество модели, drift, data quality, latency).
Плюсом будет:
Практика в задачах маркетинга/поведения клиентов: churn/retention, uplift/таргетинг, сегментации, LTV, A/B-мышление.
Опыт продуктовой аналитики и коммуникации: формулировать гипотезы, переводить результат в действие для бизнеса.
Ташкент, улица Нукус, 29А - или удаленно в любом схожем часовом поясе.
Для оформления необходимо посетить офис в Ташкенте (мы оплачиваем перелет и проживание в гостинице).
АО «ОТП Банк» (JSC «OTP Bank»)
Москва
до 350000 RUR