AI инженер/LLM инженер (RAG, Agents, Python)

Москва, улица Островитянова, 1с6

Метро: Коньково

Описание вакансии

В связи с расширением и вводом новых должностей РНИМУ им. Пирогова требуется AI‑инженер, LLM‑инженер (RAG, Agents, Python).

О вакансии
РНИМУ развивает собственную AI-платформу для задач образования, науки и внутренних цифровых сервисов университета. Ищем AI/LLM-инженера для развития интеллектуального слоя платформы.
Вам предстоит развивать RAG-контур и системы работы со знаниями: построение retrieval-пайплайнов, интеграцию LLM с внутренними сервисами, разработку агентных сценариев и механизмов формирования ответов с опорой на источники.
Архитектура платформы строится вокруг оркестрации запросов: LLM используется как компонент системы, взаимодействующий с RAG-контуром, инструментальными сервисами и внутренними данными. Ключевая задача — построение воспроизводимых и контролируемых интеллектуальных сценариев, работающих в условиях ограничений и нестабильности моделей.
Работа ведется в существующем AI-контуре (Kubernetes, Kubeflow, MLflow, vLLM, MinIO, GPU-кластер, NVIDIA GPU Operator, Volcano) с разделением на окружения разработки, тестирования и промышленной эксплуатации.

Задачи
• Разработка и развитие RAG-контура платформы
• Построение пайплайнов обработки данных: загрузка, предобработка, разбиение, индексация и поиск
• Разработка и оптимизация retrieval-логики: переранжирование, гибридный поиск, уточнение запросов
• Разработка агентных сценариев: управление tool calling, контроль выполнения и взаимодействие с внешними сервисами
• Интеграция LLM-моделей и inference-сервисов в прикладные системы
• Построение механизмов формирования ответов с опорой на источники (grounding, цитирование, проверка)
• Разработка и поддержка контуров оценки качества: тестовые наборы, сценарии, метрики
• Анализ и улучшение качества ответов на реальных данных
• Работа с корпоративными документами и неструктурированными источниками данных

Требования
• Уверенное владение Python
• Коммерческий опыт разработки от 4 лет
• Практический опыт работы с LLM, RAG и retrieval-системами
• Понимание полного цикла RAG: загрузка данных, предобработка, разбиение, эмбеддинги, индексация, поиск, переранжирование, оценка
• Опыт работы с векторным поиском или поисковыми пайплайнами
• Опыт улучшения качества поиска и ответов в production-системах
• Понимание ограничений LLM: задержки, нестабильность, галлюцинации, ограничение контекста
• Опыт интеграции LLM в backend-системы
• Опыт разработки агентных сценариев или систем с tool calling
• Опыт построения и использования метрик качества (offline/online evaluation)
• Умение оценивать и улучшать систему на основе данных
• Опыт работы с неструктурированными и “грязными” данными

Будет плюсом
• Опыт работы с LangChain, LangGraph или аналогичными фреймворками
• Опыт построения гибридного поиска (vector + keyword)
• Опыт работы с rerank-моделями и query rewriting
• Опыт работы с локальными моделями и inference-серверами (vLLM, TGI, KServe и др.)
• Опыт построения production RAG-систем
• Опыт работы с корпоративными базами знаний
• Опыт работы в ML/AI-инфраструктуре
• Понимание MLOps и model serving на уровне интеграции

Что важно для нас
• Системное понимание LLM и RAG как части архитектуры, а не набора инструментов
• Умение строить воспроизводимые, проверяемые и управляемые решения
• Умение работать с качеством: находить проблемы и улучшать систему на основе данных
• Умение принимать инженерные решения и нести за них ответственность
• Критическое мышление: понимание, где нужен агент, а где достаточно корректно спроектированного retrieval

Посмотреть контакты работодателя