ML-инженер (Middle)

Riverstart (ООО Риверстарт)

ML-инженер (Middle)

Нижний Новгород, Рождественская улица, 26

Описание вакансии

IT компания Riverstart — аккредитованы в Минцифры, входим в реестр МТК,
являемся участником Торгово-промышленной палаты РФ и Нижнего Новгорода.

С 2024г разрабатываем решения в области видео-аналитики, AI и ML. Развиваем собственный R&D центр решений в области прикладной математики и искусственного интеллекта.

В 2025г мы успешно выпустили 3 собственных продукта, основанных на алгоритмах машинного обучения.

Работаем с государством и бизнесом создавая высоконагруженные сервисы для веба и мобайла: сервисы, веб-платформы, мобильные приложения, CRM, LMS и ERP-системы.

Среди наших клиентов: Ассоциация волонтерских центров «Добро.рф», ПФК ЦСКА, Правительство Нижегородской области, Международный аэропорт «Внуково», МТС, Lamoda, «Северная долина», ХК «Спартак» Москва, ХК «Торпедо», «РОС-Химия», ГНИВЦ, ПИМУ, Фонд «Сколково» и другие компании.

Входим в топ-20 разработчиков сложных проектов в России и занимаем первую строку в рейтинге агентств по поддержке и развитию сайтов (Рейтинг Рунета 2025).

Взяли 50 наград в федеральных и международных IT-конкурсах: «Золотой сайт», «Рейтинг Рунета», «МИКС Россия» Workspace Digital Awards, Tagline Awards, Ruward Awards, G8 Creative Awards и других.

__________________

Создаём AI-системы для интеллектуальной обработки документов в закрытом контуре: извлечение структурированных данных из текстов, таблиц, сканов и изображений, построение RAG / graph-RAG, работа с локально развёрнутыми LLM. Ищем Middle ML-инженера, который отвечает за качество извлечения и поиска и доводит модель от сырых данных до продакшена

Обязанности:

  • Строить пайплайны обработки документов: парсинг, OCR, извлечение
    структурированных данных из текста, таблиц, сканов и изображений.
  • Проектировать и развивать RAG / graph-RAG системы: эмбеддинги, гибридный поиск, ранжирование, чанкинг.
  • Работать с self-hosted LLM: сервинг, оптимизация, дообучение (SFT / LoRA) под прикладные задачи.
  • Отвечать за метрики качества и их воспроизводимость — строить полноценный eval, а не оценивать результат «на глаз».

Требования:

  • Опыт коммерческой ML-разработки или эквивалентная сложность петпроектов от 2 лет.
  • Профильное высшее образование с математическим, физико-математическим или IT-профилем (прикладная математика, информатика, CS, ML и смежные). Важна сильная математическая база.
  • Продвинутая математика и статистика (линейная алгебра, оптимизация, проверка гипотез, bias-variance) с умением применять на практике.
  • Industrial Python: кастомные трансформеры, numba, асинхронные FastAPI-сервисы; тесты, профилирование, типизация.
  • Unix как среда обитания: bash-скрипты, Docker-compose, systemd, отладка контейнеров, базовая работа с K8s.
  • Production-ready ML-пайплайны: EDA → инжиниринг → обучение → валидация → деплой + мониторинг дрейфа. Опыт с Airflow, MLflow, DVC.
  • Уверенное построение RAG-систем: векторные БД, эмбеддинги, чанкинг, промптинжиниринг, оценка качества, деплой.
  • Уверенный SQL и работа с большими данными (PySpark / Polars), оптимизация запросов и пайплайнов.
  • Опыт внедрения модели в продакшн или несколько сложных end-to-end проектов в GitHub с документацией и тестами.
  • Опыт code review, написания документации, передачи знаний.

Будет плюсом:

  • Graph-RAG: построение графа знаний, multi-hop поиск, community-detection ретрив.
  • Document intelligence: OCR и layout-анализ сложных сканов, парсинг таблиц, VLM для анализа изображений и чертежей.
  • Опыт с локально развёрнутыми LLM (vLLM / TGI / llama.cpp), квантизация, дообучение.
  • Deep learning (PyTorch), распределённое обучение (DeepSpeed, FSDP).
  • Объективное сравнение моделей: статистические тесты на метриках, bootstrap.
  • Публичные выступления, конференции, поддержка open-source.

Условия:

  • Реальное влияние на то, какие продукты берутся в работу, и как они устроены.
  • Возможность карьерного роста.
  • Трудоустройство в аккредитованной IT-компании, рассматриваем и сотрудничество по ИП.
  • Удалённый или гибридный формат, гибкий график.
  • Конференции и митапы, командные выезды и неформальные посиделки.
Навыки
  • Машинное обучение
  • Bash
  • Docker
  • Apache Airflow
  • MLflow
  • SQL
  • Deep Learning
  • Kubernetes
Посмотреть контакты работодателя

Адрес

Похожие вакансии

ГНИВЦ

ML-инженер

ГНИВЦ

  • Москва

  • Не указана

Рекомендуем
  • Москва

  • Не указана

Рекомендуем
RWB (Wildberries & Russ)

Senior ML-инженер (RecSys)

RWB (Wildberries & Russ)

  • Москва

  • Не указана

Рекомендуем
Sifox
  • Москва

  • Не указана

Т1
  • Москва

  • Не указана

Страховая компания Сбербанк страхование

ML инженер (Middle)

Страховая компания Сбербанк страхование

  • Москва

  • Не указана

СОГАЗ

ML-инженер

СОГАЗ

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Simple
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

ДЖЕЙКЕТ
  • Москва

  • до 300000 RUR

СБЕР
  • Москва

  • до 300000 RUR

Платформа ОФД

Data scientist (NLP) middle

Платформа ОФД

  • Москва

  • до 250000 RUR

СБЕР
  • Москва

  • до 250000 RUR

ИЦ АЙ-ТЕКО
  • Москва

  • до 200000 RUR

amoCRM
  • Москва

  • до 210000 RUR

МТТ (MTC Exolve)
  • Москва

  • до 250000 RUR

Social Media Holding
  • Санкт-Петербург

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию