Мы ищем опытного MLOps инженера в команду внедрения ML-решений.
Эта позиция предназначена для специалистов, готовых работать с современным технологическим стеком и обеспечивать жизненный цикл ML-решений на этапе вывода в продакшен.
Чем придется заниматься:
**Развертывание и масштабирование в продакшене**
- Контейнеризация ML-моделей с использованием Docker и развертывание в Kubernetes кластерах
- Настройка и управление оркестрацией ML-пайплайнов через Apache Airflow
- Обеспечение масштабируемости и отказоустойчивости ML-сервисов в on-premise средах
**Мониторинг и оптимизация**
– Подключение сервисов к системам мониторинга и журналирования
- Анализ и устранение инцидентов в работе ML-сервисов на третьей линии поддержки
- Оптимизация использования вычислительных ресурсов и автомасштабирование рабочих нагрузок
**Интеграция и автоматизация**
- Разработка интеграций между ML-сервисами через REST API и системы обмена сообщениями (Kafka)
- Создание автоматизированных пайплайнов для обработки данных, feature engineering и тестирования моделей
- Внедрение Infrastructure as Code подходов для управления ML-инфраструктурой
Требования и навыки:
**Технические компетенции**
- Глубокое владение Python (от 3 лет) с пониманием принципов написания production-ready кода
- Опыт работы с контейнеризацией (Docker) и оркестрацией (Kubernetes) для развертывания ML-моделей
- Уверенное владение Apache Airflow для оркестрации ML-пайплайнов
**DevOps и инфраструктурные навыки**
- Понимание построения CI/CD пайплайнов для ML-решений (GitLab CI, GitHub Actions)
- Навыки работы с системами мониторинга (Prometheus, Grafana) и централизованного логирования
Будет преимуществом
**ML и данные**
- Понимание жизненного цикла ML-проектов и специфики production ML-решений
- Опыт работы с системами управления версий данных и feature store
- Базовые знания принципов машинного обучения и методов валидации моделей
**Расширенные технологические навыки**
- Опыт работы с распределенными вычислениями (Apache Spark, Hadoop)
- Знание специализированных ML-фреймворков (MLflow, ZenML)
- Опыт работы с векторными базами данных и системами поиска для RAG-приложений
Наш Технологический стек
- Оркестрация: Apache Airflow
- Контейнеризация: Docker, Kubernetes
- CI/CD: Сфера CI/CD
- Мониторинг: Prometheus, Grafana, ELK Stack
БД: Postgres, OpenSearch
Данные: S3/MinIO, HDFS
**Языки и фреймворки**
- Python (основной)
- ML библиотеки: CatBoost, scikit-learn, PyTorch, Keras
- REST API разработка (FastAPI)
- Apache Kafka
-Apache Spark
Что мы предлагаем:
- Работу с современными технологиями на переднем крае MLOps индустрии
- Участие в проектах полного цикла - от исследований до production развертывания
- Возможность влиять на архитектурные решения и выбор технологического стека
- Глубокое погружение в практики MLOps с опытными коллегами из индустрии
- Участие в конференциях и обучающих программах по передовым ML технологиям
- Работу с реальными production ML-сервисами
- Доступ к современной инфраструктуре и вычислительным ресурсам
- Поддержку инициатив по внедрению новых технологий и улучшению процессов
Москва
Не указана