Ведущий инженер по прикладному ИИ (Senior Applied AI Engineer)

Hi, Rockits!

Ведущий инженер по прикладному ИИ (Senior Applied AI Engineer)

Описание вакансии

Мы ищем ведущего специалиста по прикладному ИИ, который будет создавать промышленные AI‑системы для обработки документов в масштабе. Вы будете проектировать и внедрять продуктовые функции, основанные на агентных подходах, мультимодальности и автоматизированной оценке качества: извлечение данных, рассуждение, генерация, оркестрация. Вы будете отвечать за всё — от архитектуры и экспериментов до латентности, стоимости, надёжности и влияния на пользовательский опыт.

Роль сочетает разработку собственных моделей с интеграцией LLM‑API, чтобы создавать интеллектуальные, готовые к эксплуатации функции. Вы будете работать на всём жизненном цикле: от подготовки обучающих данных и тонкой настройки моделей до проектирования retrieval‑пайплайнов и развёртывания производительных систем инференса в облаке.

Обязанности

  • Решать задачи в области интеллектуальной обработки документов: OCR, структурированное извлечение данных, разбивка на чанки, layout‑aware парсинг, преобразование PDF в заданную схему данных.

  • Проектировать и внедрять RAG‑пайплайны с использованием векторных баз данных, гибридного поиска, реранжирования и структурированной сборки контекста.

  • Интегрировать облачные LLM‑API (OpenAI, Anthropic) в продуктовые функции, а там, где это необходимо, использовать собственные небольшие модели.

  • Строить и дообучать трансформерные модели для задач классификации, извлечения данных, ранжирования и генерации.

  • Разрабатывать масштабируемые сервисы инференса с использованием vLLM, батчирования, стриминга, кэширования и других оптимизаций задержек и стоимости.

  • Проектировать и поддерживать Python‑микросервисы и REST API (FastAPI) для внутренних AI‑ и NLP‑пайплайнов.

  • Создавать MCP‑сервисы (Model Control & Processing) для взаимодействия с LLM, векторными хранилищами и пайплайнами обработки.

  • Разрабатывать CI/CD и пайплайны развёртывания для AI‑продуктов (GitHub + Docker + Cloud Run + Terraform).

  • Обеспечивать бесшовное взаимодействие между инфраструктурной командой и командами NLP/ML, помогая внедрять фичи и оптимизировать сервинг моделей.

  • Развивать и поддерживать мониторинг, наблюдаемость и логирование (Prometheus, Grafana, OpenTelemetry).

  • Создавать внутренние инструменты разработки и SDK для ускорения экспериментов и вывода в продакшен AI‑команды.

  • Участвовать в реагировании на инциденты и оптимизировать производительность систем в различных окружениях.

  • Создавать промышленные пайплайны для обучения, оценки, управления промптами/версиями моделей и развёртывания.

  • Определять и повышать качество AI‑решений с помощью офлайн‑эвалюаций, регрессионных наборов данных и метрик на уровне конкретных задач (точность, латентность, надёжность).

Требования

  • Сильный Python‑бэкграунд: написание промышленного кода, тесты, поддержка архитектуры сервисов. Опыт разработки микросервисов и REST API (FastAPI).

  • Практический опыт работы с PyTorch и HuggingFace: обучение, тонкая настройка, инференс, отладка моделей.

  • Глубокое понимание внутреннего устройства трансформеров: токенизация, эмбеддинги, стратегии декодирования, оценка качества.

  • Опыт интеграции OpenAI / Anthropic в реальные пользовательские продукты (не только прототипы).

  • Реальный опыт создания RAG‑систем: чанкинг, эмбеддинг‑пайплайны, векторный поиск, реранжирование, сборка контекста, снижение галлюцинаций.

  • Опыт работы с OCR, парсингом PDF, извлечением таблиц и форм, нормализацией «грязных» реальных данных.

  • Опыт построения масштабируемых систем инференса/модельного сервинга; знакомство с vLLM или аналогичными стеками будет плюсом.

  • Умение отлаживать проблемы качества моделей на уровне промптов, retrieval, данных, эвалюационных наборов и поведения инференса.

  • Готовность поддерживать системы в эксплуатации: развёртывание, мониторинг, отладка инцидентов, итеративное улучшение.

  • Опыт работы с CI/CD (GitHub Actions или аналоги), Docker, Cloud Run (или GKE), Terraform.

  • Свободный английский (команда международная)

    Будет плюсом

  • Опыт развёртывания ML/AI‑сервисов с Docker на GCP (Cloud Run, GKE).

  • Опыт работы с OpenTelemetry, Prometheus, Grafana или аналогичными инструментами наблюдаемости.

  • Сильный бэкграунд в области распознавания документов, OCR, структурированного парсинга PDF.

  • Опыт оптимизации инференса по латентности и стоимости (батчирование, кэширование, маршрутизация, спекулятивное декодирование).

    Условия работы

  • Удалённый формат (обсуждаемо).

  • Работа в команде профессионалов над продуктом с высокой нагрузкой и миллионной аудиторией.

  • Возможность влиять на архитектуру и технологический стек.

  • Конкурентная заработная плата.

Навыки
  • Python
  • vLLM
  • MCP
Посмотреть контакты работодателя

Похожие вакансии

Элоконт

Senior ML Engineer

Элоконт

  • Москва

  • Не указана

Рекомендуем
  • Москва

  • Не указана

Рекомендуем
Outlines Technologies

Инженер MLOps

Outlines Technologies

  • Москва

  • до 445000 RUR

Рекомендуем
evrone.ru
  • Москва

  • до 445000 RUR

Spice IT
  • Москва

  • до 445000 RUR

Gradient
  • Москва

  • от 450000 RUR

Cloud.ru
  • Москва

  • от 450000 RUR

  • Москва

  • до 7000 USD

  • Москва

  • до 7000 USD

Senior Python Developer

Филиал компании Лист Ренталс Лимитед

  • Москва

  • до 7000 USD

  • Москва

  • до 7000 USD

Postgres Professional

AI инженер

Postgres Professional

  • Москва

  • до 7000 USD

«UZUM TECHNOLOGIES»
  • Москва

  • до 7000 USD

Marfatech
  • Москва

  • до 7000 USD

ML Lead (CV\DL)

Клауд Атлас

  • Москва

  • до 7000 USD

АЙФЭЛЛ

Инженер MLOps

АЙФЭЛЛ

  • Москва

  • до 7000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию