ML-инженер (Middle)

Нижний Новгород, Рождественская улица, 26

Описание вакансии

IT компания Riverstart — аккредитованы в Минцифры, входим в реестр МТК,
являемся участником Торгово-промышленной палаты РФ и Нижнего Новгорода.

С 2024г разрабатываем решения в области видео-аналитики, AI и ML. Развиваем собственный R&D центр решений в области прикладной математики и искусственного интеллекта.

В 2025г мы успешно выпустили 3 собственных продукта, основанных на алгоритмах машинного обучения.

Работаем с государством и бизнесом создавая высоконагруженные сервисы для веба и мобайла: сервисы, веб-платформы, мобильные приложения, CRM, LMS и ERP-системы.

Среди наших клиентов: Ассоциация волонтерских центров «Добро.рф», ПФК ЦСКА, Правительство Нижегородской области, Международный аэропорт «Внуково», МТС, Lamoda, «Северная долина», ХК «Спартак» Москва, ХК «Торпедо», «РОС-Химия», ГНИВЦ, ПИМУ, Фонд «Сколково» и другие компании.

Входим в топ-20 разработчиков сложных проектов в России и занимаем первую строку в рейтинге агентств по поддержке и развитию сайтов (Рейтинг Рунета 2025).

Взяли 50 наград в федеральных и международных IT-конкурсах: «Золотой сайт», «Рейтинг Рунета», «МИКС Россия» Workspace Digital Awards, Tagline Awards, Ruward Awards, G8 Creative Awards и других.

__________________

Создаём AI-системы для интеллектуальной обработки документов в закрытом контуре: извлечение структурированных данных из текстов, таблиц, сканов и изображений, построение RAG / graph-RAG, работа с локально развёрнутыми LLM. Ищем Middle ML-инженера, который отвечает за качество извлечения и поиска и доводит модель от сырых данных до продакшена

Обязанности:

Строить пайплайны обработки документов: парсинг, OCR, извлечение
структурированных данных из текста, таблиц, сканов и изображений.
Проектировать и развивать RAG / graph-RAG системы: эмбеддинги, гибридный поиск, ранжирование, чанкинг.
Работать с self-hosted LLM: сервинг, оптимизация, дообучение (SFT / LoRA) под прикладные задачи.
Отвечать за метрики качества и их воспроизводимость — строить полноценный eval, а не оценивать результат «на глаз».

Требования:

Опыт коммерческой ML-разработки или эквивалентная сложность петпроектов от 2 лет.
Профильное высшее образование с математическим, физико-математическим или IT-профилем (прикладная математика, информатика, CS, ML и смежные). Важна сильная математическая база.
Продвинутая математика и статистика (линейная алгебра, оптимизация, проверка гипотез, bias-variance) с умением применять на практике.
Industrial Python: кастомные трансформеры, numba, асинхронные FastAPI-сервисы; тесты, профилирование, типизация.
Unix как среда обитания: bash-скрипты, Docker-compose, systemd, отладка контейнеров, базовая работа с K8s.
Production-ready ML-пайплайны: EDA → инжиниринг → обучение → валидация → деплой + мониторинг дрейфа. Опыт с Airflow, MLflow, DVC.
Уверенное построение RAG-систем: векторные БД, эмбеддинги, чанкинг, промптинжиниринг, оценка качества, деплой.
Уверенный SQL и работа с большими данными (PySpark / Polars), оптимизация запросов и пайплайнов.
Опыт внедрения модели в продакшн или несколько сложных end-to-end проектов в GitHub с документацией и тестами.
Опыт code review, написания документации, передачи знаний.

Будет плюсом:

Graph-RAG: построение графа знаний, multi-hop поиск, community-detection ретрив.
Document intelligence: OCR и layout-анализ сложных сканов, парсинг таблиц, VLM для анализа изображений и чертежей.
Опыт с локально развёрнутыми LLM (vLLM / TGI / llama.cpp), квантизация, дообучение.
Deep learning (PyTorch), распределённое обучение (DeepSpeed, FSDP).
Объективное сравнение моделей: статистические тесты на метриках, bootstrap.
Публичные выступления, конференции, поддержка open-source.

Условия:

Реальное влияние на то, какие продукты берутся в работу, и как они устроены.
Возможность карьерного роста.
Трудоустройство в аккредитованной IT-компании, рассматриваем и сотрудничество по ИП.
Удалённый или гибридный формат, гибкий график.
Конференции и митапы, командные выезды и неформальные посиделки.