Цель роли:
Построение набора моделей risk-based pricing для определения индивидуальной скидки на топливо (в $/галлон) для клиентов на основе 20–30 факторов. Предполагается построение моделей для новых, текущих и уходящих клиентов.
Основные задачи:
- Анализ и очистка исторических выгрузок (2–3 ГБ Excel-данных)
- Проектирование и реализация нескольких моделей оценки скидки для разных категорий клиентов
- Фиче-инжиниринг и отбор признаков (20–30 факторов: финансы, поведение, отрасль и др.)
- Обучение и калибровка моделей (например, LightGBM, XGBoost, Logistic Regression)
- Разработка explainable моделей (SHAP, feature importance)
- Построение системы оценки бизнес-эффекта (uplift, sensitivity-анализ)
- Подготовка модели для использования финансовым отделом и возможной автоматизации через API
- Документирование гипотез, логики, переменных и интерпретаций моделей
- Рекомендации по развертыванию (batch scoring, API, обновление моделей)
- Планирование регулярного пересчета модели (ежеквартально)
Требуемые навыки и опыт:
- 3–5+ лет практического опыта в Data Science или Applied ML
- Опыт построения скоринговых, риск-моделей или моделей ценообразования
- Уверенное владение Python, pandas, scikit-learn, XGBoost/LightGBM
- Навыки фиче-инжиниринга и построения explainable моделей (SHAP и др.)
- Понимание логики ценообразования, discounting и анализа чувствительности
- Умение работать с Excel-данными большого объема
- Навыки самостоятельной работы от анализа до рекомендаций по внедрению
Будет плюсом:
- Опыт работы в финтехе, e-commerce или с динамическим ценообразованием
- Навыки деплоя ML-моделей (FastAPI, Docker, MLflow)
- Опыт построения scorecard-моделей
- Навыки визуализации моделей и результатов (Plotly, Streamlit)
Технологии и инструменты:
- Python (pandas, sklearn, XGBoost, LightGBM, SHAP)
- Excel, Jupyter, SQL (опционально)
- MLflow, Streamlit (при необходимости)
- FastAPI (для возможного продакшн-использования)
Мы предлагаем:
- Уровень оплаты обсуждается индивидуально (в зависимости от компетенций).
- Прямой доступ к руководству: вас услышат.
- График 5/2, праздники и выходные по американскому производственному календарю.
- Гибридный формат работы.
- Релоканты также рассматриваются.
Пожалуйста, прикрепите к отклику портфолио или примеры кейсов, которые вы решали ранее.