В сопроводительном письме, пожалуйста, укажите город в котором сейчас находитесь.
💡 Контекст
Ты создашь ядро платформы — модель, которая на основе площади, года постройки, климат-зоны и истории ремонтов дома предсказывает стоимость HVAC / Water Heater / Panel upgrade, включая диапазоны и confidence.
Fuse имеет богатую эмпирическую базу (тысячи инвойсов и смет из ServiceTitan и Housecall Pro), а также публичные данные (permits, assessor).
Тебе нужно построить data-pipeline и обучающую модель, которая ляжет в основу API /v1/estimate/predict.
🎯 Твоя миссия
Создать ML-модуль, который выдаёт точный диапазон CAPEX-оценки с объяснимыми фичами и confidence.
Подключить данные из CRM (через ETL) и внешних источников, построить фичи, обучить XGBoost/LightGBM модель и обернуть в FastAPI-сервис.
🧩 Твои задачи
Подготовить и очистить исторические данные Fuse (jobs, estimates, invoices, equipment, pricebook).
Построить пайплайн feature engineering (по гео, дому, утилити, сезонности, типу системы и т.д.).
Обучить и протестировать ML-модель (XGBoost/LightGBM/CatBoost).
Реализовать FastAPI-endpoint /v1/estimate/predict.
Сохранять метаданные моделей (версия, MAPE, R², фичи).
Настроить мониторинг качества и переобучение (1 раз в месяц).
Работать в паре с Full-Stack Lead (интеграция API → UI).
⚙️ Технологии
Python, FastAPI, Pandas, NumPy
XGBoost, CatBoost, LightGBM
PostgreSQL, S3, Prefect/Airflow (для ETL)
MLflow / Weights&Biases (мониторинг)
Docker, AWS / EC2 / Lambda
🔍 Требования
3+ лет опыта как Data Scientist / ML Engineer
Опыт в регрессионных задачах (pricing / forecasting / cost modeling)
Умение работать с табличными данными и категориями
Опыт построения API (FastAPI/Flask)
Понимание фичей: гео, сезонность, инженерные параметры
Владение Git, Docker, базовым CI/CD
⭐ Будет плюсом
Опыт работы с данными ServiceTitan / Housecall Pro или аналогичных CRM
Опыт обучения explainable моделей (feature importances, SHAP)
Знание архитектуры MLOps (pipelines, monitoring, retraining)
💰 Условия
Формат: remote / contractor
Оплата: $3000-4000 в месяц
Прямая работа с CEO и Full-Stack Lead
Возможность перейти в ML-core команду Fuse (в дальнейшем прогнозирование спроса/рентабельности)