Обучать модели в OCR-пайплайне: CNN, VLM, LLM;
Обучать модели для NLP-пайплайнов: классификация документов, NER, доменная адаптация;
Выдвигать и проверять гипотезы при реализации задач машинного обучения;
Участвовать в проработке архитектуры ml-пайплайнов;
Развивать генератор синтетических данных для обучения OCR-моделей;
Готовить модели для инференса и вывода в промышленную эксплуатацию
Имеете коммерческий опыт работы с задачами компьютерного зрения и NLP от 1–2 лет;
Работали с задачами: OCR (распознавание текста), детекции объектов, сегментации изображений;
Работали с мультимодальными моделями (Vision-Language Models, VLM);
Занимались выводом CV-моделей в продакшн (deployment, мониторинг, поддержка);
Знаете и имеете опыт решения ключевых задач NLP: классификация текстов, NER, суммаризация, поиск и др.;
Применяли классические методы (TF-IDF, word2vec и др.) и современные подходы (transformer-based модели);
Работали с Large Language Models (LLM), VLM не менее года;
Занимались дообучением моделей: с использованием адаптеров (LoRA, PEFT и др.) и full fine-tuning;
Использовали инструменты: ONNX, TensorRT, vLLM, SGLang;
Занимались сбором и подготовкой данных для CV и NLP задач: веб-скрапинг, парсинг открытых источников, генерация синтетических данных;
Понимаете проблемы качества данных и методы их решения.
Занимались построением решений на базе LLM, VLM: чат-боты, RAG-системы, агентные пайплайны;
Имеете опыт вывода LLM, VLM в продакшн, ускорения и оптимизации моделей квантизация, pruning, batching и др.;
Работали с мультимодальными пайплайнами (CV + NLP + LLM);
Занимались построением end-to-end ML систем.
Финфрейм
Москва
до 400000 RUR