Lamoda ищет MLOps-инженера в команду, где ML действительно работает в проде, приносит миллиарды и выходит на новый уровень с LLM и нейросетями. Строим ML-платформу полного цикла на базе Kubernetes — от экспериментов до inference-as-a-service с Triton и векторными БД, чтобы ускорить запуск AI-продуктов с месяцев до недель.
Чем предстоит заниматься:
Проектированием, развертыванием и сопровождением инфраструктуры хранения и поиска векторных представлений данных;
Выбирать, интегрировать и оптимизировать векторные базы данных (Milvus, Qdrant, pgvector и др.) с учетом алгоритмов ANN (HNSW, IVF, PQ);
Разрабатывать конвейеры для генерации, индексации и обновления эмбеддингов;
Настраивать системы мониторинга и алертинга для ML-сервисов, инфраструктурных компонентов и хранилищ;
Внедрять и развивать общие MLOps-инструменты: CI/CD пайплайны на базе GitLab, Model Registry, Feature Store, Data Quality, мониторинг моделей;
Поддерживать и развивать платформенные компоненты: кластеров, систем оркестрации, пайплайнов обработки данных, систем развёртывания;
Взаимодействовать с командами Data Scientist, Data Engineering и Platform-инженерами для обеспечения стабильной и масштабируемой инфраструктуры;
Поддерживать и оптимизировать инфраструктуры в Yandex Cloud и Bare Metal с использованием IaC-подходов.
Мы ожидаем:
Опыт разработки, внедрения и автоматизации ML или Data Engineering решений;
Понимание архитектуры и принципов работы векторных баз данных;
Опыт построения ML-конвейеров (Airflow, MLflow, Kubeflow и др.);
Понимание принципов CI/CD, разработки и эксплуатации распределённых систем;
Уверенный опыт работы с Kubernetes, Helm, Docker, Terraform;
Практический опыт работы со Spark, Airflow;
Уверенное владение Python и Linux;
Понимание основ алгоритмов машинного обучения;
Понимание работы LLM и RAG-паттернов.
Матчинг Гэлэкси
Москва
Не указана