IT компания Riverstart — аккредитованы в Минцифры, входим в реестр МТК,
являемся участником Торгово-промышленной палаты РФ и Нижнего Новгорода.
С 2024г разрабатываем решения в области видео-аналитики, AI и ML. Развиваем собственный R&D центр решений в области прикладной математики и искусственного интеллекта.
В 2025г мы успешно выпустили 3 собственных продукта, основанных на алгоритмах машинного обучения.
Работаем с государством и бизнесом создавая высоконагруженные сервисы для веба и мобайла: сервисы, веб-платформы, мобильные приложения, CRM, LMS и ERP-системы.
Среди наших клиентов: Ассоциация волонтерских центров «Добро.рф», ПФК ЦСКА, Правительство Нижегородской области, Международный аэропорт «Внуково», МТС, Lamoda, «Северная долина», ХК «Спартак» Москва, ХК «Торпедо», «РОС-Химия», ГНИВЦ, ПИМУ, Фонд «Сколково» и другие компании.
Входим в топ-20 разработчиков сложных проектов в России и занимаем первую строку в рейтинге агентств по поддержке и развитию сайтов (Рейтинг Рунета 2025).
Взяли 50 наград в федеральных и международных IT-конкурсах: «Золотой сайт», «Рейтинг Рунета», «МИКС Россия» Workspace Digital Awards, Tagline Awards, Ruward Awards, G8 Creative Awards и других.
__________________
Создаём AI-системы для интеллектуальной обработки документов в закрытом контуре: извлечение структурированных данных из текстов, таблиц, сканов и изображений, построение RAG / graph-RAG, работа с локально развёрнутыми LLM. Ищем Middle ML-инженера, который отвечает за качество извлечения и поиска и доводит модель от сырых данных до продакшена
Обязанности:
- Строить пайплайны обработки документов: парсинг, OCR, извлечение
структурированных данных из текста, таблиц, сканов и изображений. - Проектировать и развивать RAG / graph-RAG системы: эмбеддинги, гибридный поиск, ранжирование, чанкинг.
- Работать с self-hosted LLM: сервинг, оптимизация, дообучение (SFT / LoRA) под прикладные задачи.
- Отвечать за метрики качества и их воспроизводимость — строить полноценный eval, а не оценивать результат «на глаз».
Требования:
- Опыт коммерческой ML-разработки или эквивалентная сложность петпроектов от 2 лет.
- Профильное высшее образование с математическим, физико-математическим или IT-профилем (прикладная математика, информатика, CS, ML и смежные). Важна сильная математическая база.
- Продвинутая математика и статистика (линейная алгебра, оптимизация, проверка гипотез, bias-variance) с умением применять на практике.
- Industrial Python: кастомные трансформеры, numba, асинхронные FastAPI-сервисы; тесты, профилирование, типизация.
- Unix как среда обитания: bash-скрипты, Docker-compose, systemd, отладка контейнеров, базовая работа с K8s.
- Production-ready ML-пайплайны: EDA → инжиниринг → обучение → валидация → деплой + мониторинг дрейфа. Опыт с Airflow, MLflow, DVC.
- Уверенное построение RAG-систем: векторные БД, эмбеддинги, чанкинг, промптинжиниринг, оценка качества, деплой.
- Уверенный SQL и работа с большими данными (PySpark / Polars), оптимизация запросов и пайплайнов.
- Опыт внедрения модели в продакшн или несколько сложных end-to-end проектов в GitHub с документацией и тестами.
- Опыт code review, написания документации, передачи знаний.
Будет плюсом:
- Graph-RAG: построение графа знаний, multi-hop поиск, community-detection ретрив.
- Document intelligence: OCR и layout-анализ сложных сканов, парсинг таблиц, VLM для анализа изображений и чертежей.
- Опыт с локально развёрнутыми LLM (vLLM / TGI / llama.cpp), квантизация, дообучение.
- Deep learning (PyTorch), распределённое обучение (DeepSpeed, FSDP).
- Объективное сравнение моделей: статистические тесты на метриках, bootstrap.
- Публичные выступления, конференции, поддержка open-source.
Условия:
- Реальное влияние на то, какие продукты берутся в работу, и как они устроены.
- Возможность карьерного роста.
- Трудоустройство в аккредитованной IT-компании, рассматриваем и сотрудничество по ИП.
- Удалённый или гибридный формат, гибкий график.
- Конференции и митапы, командные выезды и неформальные посиделки.