Разработка и оптимизация ML-моделей в направлениях CV и NLP/LLM.
Создание и развитие RAG-систем, работа с векторными БД, эмбеддингами и графовыми поисками.
Оборачивание моделей в production-ready сервисы (FastAPI, Docker).
Оптимизация инференса и настройка пайплайнов обучения.
Построение инфраструктуры для обучения, мониторинга и деплоя моделей.
Уверенные знания Python, опыт работы с PyTorch, Transformers, scikit-learn, pandas, numpy.
Практический опыт в Computer Vision (CVAT, LabelStudio).
Опыт с NLP/LLM, построением RAG-систем, векторными БД (LangChain, E5/RuBERT).
Навыки написания API (FastAPI), понимание асинхронности, упаковка моделей в сервисы.
Знание методов ускорения инференса (ONNX, TensorRT, Triton Inference Server, vLLM).
Опыт с MLflow, Airflow, понимание CI/CD для ML.
Работа под Linux, знание Docker, взаимодействие с Kafka/RabbitMQ.
Опыт работы с PostgreSQL, MongoDB, Qdrant, Neo4j.
Опыт работы с Graph RAG и гибридным поиском.
Знание инструментов мониторинга (Prometheus, Grafana, Langfuse).
RAG / LLM: Qdrant, LangChain, RAGAS, Hybrid Search, Reranking, Langfuse, vLLM
ML / DL: PyTorch, Transformers, CLIP, CatBoost, scikit-learn, TF-IDF, FastText
Backend / API: FastAPI, SQLAlchemy, Alembic, Pytest
MLOps / CI/CD: MLflow, Airflow, Triton, GitLab CI/CD
Infra & Data: Docker, Prometheus, Grafana, Kafka, RabbitMQ, S3 (Minio), CVAT, LabelStudio
Оформление по ТК РФ в аккредитованной IT-компании
Полностью удалённый формат работы
ДМС со стоматологией (по всей России)
Страхование жизни и путешествий
Корпоративная мобильная связь и ноутбук
Система премирования — квартальная и годовая
Программа BestBenefits со скидками
Health Care: ежемесячные медицинские консультации
Москва
от 200000 RUR
Москва
от 200000 RUR