Ищем ML инженера в RecSys команду Premier у которого руки чешутся растить метрики в онлайне (watch time per user, ctr и тд) с масштабом 10М+ MAU пользователей.
Чем предстоит заниматься:
- Разрабатывать рекомендательные ML модели (ранжирование и кандидатные модели) и обеспечивать их обучение, тестирование, развертывание, отслеживание экспериментов, улучшая опыт пользователей в онлайн-кинотеатре;
- Участвовать в эксплуатации и развитии решений для управления жизненным циклом ML-моделей: сервисов обучения, хранения и мониторинга ML моделей; инструментов для аналитики и визуализации; data quality; feature store и т.п.;
- Совместно с дата-инженерами участвовать в процессах работы с витринами данных для моделей, версионировании и проверке датасетов;
Что ожидаем от кандидата:
Необходимые опыт и знания для этой позиции
- Знание методов и алгоритмов ML/DL;
- Опыт разработки, внедрения и автоматизации ML решений в production;
- Хорошее знание Python, CI/CD практик, git, Docker, K8s;
- Опыт работы с классическими инструментами организации жизненного цикла моделей (mlflow / ClearML / W&B);
- Опыт разворачивания моделей как сервисов на CPU и GPU инфраструктуре, например, на базе Triton Inference Server на PyTorch, TF, ONNX бэкендах;
- Опыт работы со средствами оркестрации пайплайнов (AirFlow / dagster / Kedro / Luigi);
Будет плюсом
- Опыт работы и знание Spark;
- Опыт использования онлайн и оффлайн feature stores;
- Опыт работы со стриминговыми данными, Spark Streaming, Flink;
- Знакомство с векторными БД - Qdrant / Milvus / Weviate;
График и формат работы:
-
Гибкий график, работа в офисе в центре Санкт-Петербурга (м. Чернышевская), в Москве (м.Сокол), либо полностью удаленный формат.