В компании клиента (консалтинг) открыта позиция ML Engineer (прогнозирование спроса)
Обязанности:
Полный цикл разработки ML-проекта:
- Сбор требований, предпроектное обследование, анализ данных, построение и валидация моделей, вывод моделей в прошленную эксплуатацию.
- Разработка моделей прогнозирования спроса на основе классических алгоритмов машинного обучения (градиентный бустинг, линейные модели, случайный лес и т.д.).
- Поддержка внутренних инструментов на базе классического машинного обучения.
- Оптимизация моделей по качеству и скорости расчёта.
- Разработка пайплайнов обработки данных (pandas, numpy, scikit-learn, feature engineering).
- Вывод модели в промышленную эксплуатацию: контейнеризация (Docker), создание API (FastAPI/Flask), настройка CI/CD.
- Мониторинг качества прогнозов в production, автоматическая переобучение при необходимости.
- Документирование решения, презентация результатов бизнес-заказчику.
Требования:
- Python — уверенное владение, опыт написания production-кода (pytest, typing).
- Классический ML: scikit-learn, XGBoost / LightGBM / CatBoost, знание методов работы с временными рядами.
- Опыт разработки моделей прогнозирования спроса или аналогичных задач.
- Умение работать с большими объёмами данных (pandas, numpy, оптимизация памяти и времени расчета).
- Опыт контейнеризации (Docker) и развёртывания ML-сервисов (CI/CD, Linux).
- Понимание жизненного цикла ML-проекта — от гипотезы до эксплуатации.
Технический стек:
- Язык программирования: Python (3.11+)
- Библиотеки для работы с данными и feature engineering: pandas, numpy, polars(плюс)
- Классический ML: scikit-learn, XGBoost, LightGBM, CatBoost
- Разработка и тестирование: pytest, typing, git
- Контейнеризация и оркестрация: Docker, docker-compose
- CI/CD: GitLab CI / GitHub Actions (настроить пайплайны для тестирования, сборки и деплоя)
- API и сервисный слой: FastAPI / Flask
- Базы данных: SQL - базовые знания (PostgreSQL), ClickHouse(плюс)
- Временные ряды (плюс): statsmodels, prophet
- Мониторинг и логирование(плюс): Prometheus + Grafana (базово), ELK / Loki
- Дополнительно (плюс): Apache Spark / Dask (для масштабирования), MLflow (для отслеживания экспериментов)
- Отдельный плюс в карму - опыт работы в роли Demand planning manager