О проекте:
Мы создаём интеллектуальный модуль анализа и прогнозирования данных в составе системы автоматизации портовой инфраструктуры. Модуль обрабатывает миллионы событий в реальном времени, обучает модели, выявляет аномалии, оптимизирует процессы и помогает системе принимать решения автоматически.
Основные задачи:
- Разработка и обучение ML-моделей для классификации, прогнозирования и детекции аномалий.
- Построение end-to-end ML-пайплайнов: сбор → обработка → feature engineering → обучение → деплой.
- Работа с потоковыми данными (Kafka / MQTT) и реализация моделей в real-time режиме.
- Интеграция ML-модулей с backend-микросервисами (REST / gRPC).
- Оптимизация производительности моделей и inference.
- Настройка мониторинга моделей (MLOps, drifts, метрики качества).
- Разработка сервисов предиктивной аналитики и автоматизации планирования.
- Подготовка датасетов, валидация данных, контроль качества.
- Взаимодействие с backend-командой для внедрения вычислительных модулей в инфраструктуру.
Технический стек:
- Python 3.10+, FastAPI
- pandas, numpy, scikit-learn, PyTorch / TensorFlow
- Airflow / Prefect / Dagster
- Kafka / RabbitMQ, Redis
- Docker, Kubernetes, CI/CD
- Grafana, Prometheus, ELK для мониторинга
- MLflow / Weights & Biases для экспериментов и трекинга моделей
Требования:
- Опыт коммерческой работы с ML от 2–3 лет.
- Уверенные навыки Python и ML-библиотек (sklearn, PyTorch/TensorFlow).
- Опыт построения полноценного ML-пайплайна.
- Опыт работы с потоковыми данными или большими датасетами.
- Понимание MLOps-подходов: деплой моделей, мониторинг, обновление.
- Понимание алгоритмов машинного обучения, статистики и feature engineering.
- Умение документировать решения, писать чистый и структурированный код.
Будет плюсом:
- Опыт с системами реального времени (Kafka/MQTT).
- Работа с компьютерным зрением или обработкой видео.
- Опыт предиктивной аналитики в промышленности / логистике.
- Работа с BI-инструментами (Grafana, PowerBI).
- Опыт оптимизации inference (ONNX, TensorRT, quantization).
Условия:
- Уровень — Middle / Middle+ / Senior.
- Формат — оффлайн.
- Занятость — полная.