ML Engineer (прогнозирование спроса)

Москва, Таганская улица

Описание вакансии

В компании клиента (консалтинг) открыта позиция

ML Engineer (прогнозирование спроса)

Обязанности:

Полный цикл разработки ML-проекта:

Сбор требований, предпроектное обследование, анализ данных, построение и валидация моделей, вывод моделей в прошленную эксплуатацию.
Разработка моделей прогнозирования спроса на основе классических алгоритмов машинного обучения (градиентный бустинг, линейные модели, случайный лес и т.д.).
Поддержка внутренних инструментов на базе классического машинного обучения.
Оптимизация моделей по качеству и скорости расчёта.
Разработка пайплайнов обработки данных (pandas, numpy, scikit-learn, feature engineering).
Вывод модели в промышленную эксплуатацию: контейнеризация (Docker), создание API (FastAPI/Flask), настройка CI/CD.
Мониторинг качества прогнозов в production, автоматическая переобучение при необходимости.
Документирование решения, презентация результатов бизнес-заказчику.

Требования:

Python — уверенное владение, опыт написания production-кода (pytest, typing).
Классический ML: scikit-learn, XGBoost / LightGBM / CatBoost, знание методов работы с временными рядами.
Опыт разработки моделей прогнозирования спроса или аналогичных задач.
Умение работать с большими объёмами данных (pandas, numpy, оптимизация памяти и времени расчета).
Опыт контейнеризации (Docker) и развёртывания ML-сервисов (CI/CD, Linux).
Понимание жизненного цикла ML-проекта — от гипотезы до эксплуатации.

Технический стек:

Язык программирования: Python (3.11+)
Библиотеки для работы с данными и feature engineering: pandas, numpy, polars(плюс)
Классический ML: scikit-learn, XGBoost, LightGBM, CatBoost
Разработка и тестирование: pytest, typing, git
Контейнеризация и оркестрация: Docker, docker-compose
CI/CD: GitLab CI / GitHub Actions (настроить пайплайны для тестирования, сборки и деплоя)
API и сервисный слой: FastAPI / Flask
Базы данных: SQL - базовые знания (PostgreSQL), ClickHouse(плюс)
Временные ряды (плюс): statsmodels, prophet
Мониторинг и логирование(плюс): Prometheus + Grafana (базово), ELK / Loki
Дополнительно (плюс): Apache Spark / Dask (для масштабирования), MLflow (для отслеживания экспериментов)
Отдельный плюс в карму - опыт работы в роли Demand planning manager