Москва, проспект Андропова, 10А
Метро: АвтозаводскаяЧем предстоит заниматься:
Управление ML-инфраструктурой:
Администрировать и развивать системы оркестрации экспериментов и обучения моделей;
Поддерживать и развивать сервисы для управления ML-workflow;
Работать с системами версионирования данных и моделей;
Мониторить и поддерживать системы инференса моделей.
DevOps и автоматизация:
Развёртывать и поддерживать ML-сервисы в контейнеризованной среде;
Настраивать CI/CD-процессы для ML-проектов;
Мониторить инфраструктуру и производительность ML-систем;
Автоматизировать развёртывание и управление ML-пайплайнами.
Разработка и стандартизация:
Участвовать в разработке внутренних инструментов для упрощения MLOps-процессов;
Создавать документацию и регламенты для работы с ML-артефактами;
Поддерживать распределённое обучение моделей.
Что мы ждём от кандидата:
Опыт работы с MLOps-инструментами (ClearML, MLflow, Kubeflow или аналогами) от 1 года;
Уверенное владение Python для разработки сервисов и автоматизации;
Опыт работы с контейнеризацией и оркестрацией (Docker, Kubernetes);
Понимание CI/CD-процессов и опыт их настройки;
Базовое понимание машинного обучения и жизненного цикла ML-моделей;
Опыт разработки веб-сервисов и API;
Знание Linux и навыки системного администрирования.
Будет плюсом:
Опыт работы с системами версионирования данных (например, DVC);
Понимание принципов работы современных ML-моделей;
Опыт настройки систем мониторинга (например, Prometheus, Grafana);
Опыт работы с фреймворками глубокого обучения (PyTorch, TensorFlow).