Москва, улица Островитянова, 1с6
Метро: КоньковоВ связи с расширением и вводом новых должностей РНИМУ им. Пирогова требуется AI‑инженер, LLM‑инженер (RAG, Agents, Python).
О вакансии
РНИМУ развивает собственную AI-платформу для задач образования, науки и внутренних цифровых сервисов университета. Ищем AI/LLM-инженера для развития интеллектуального слоя платформы.
Вам предстоит развивать RAG-контур и системы работы со знаниями: построение retrieval-пайплайнов, интеграцию LLM с внутренними сервисами, разработку агентных сценариев и механизмов формирования ответов с опорой на источники.
Архитектура платформы строится вокруг оркестрации запросов: LLM используется как компонент системы, взаимодействующий с RAG-контуром, инструментальными сервисами и внутренними данными. Ключевая задача — построение воспроизводимых и контролируемых интеллектуальных сценариев, работающих в условиях ограничений и нестабильности моделей.
Работа ведется в существующем AI-контуре (Kubernetes, Kubeflow, MLflow, vLLM, MinIO, GPU-кластер, NVIDIA GPU Operator, Volcano) с разделением на окружения разработки, тестирования и промышленной эксплуатации.
Задачи
• Разработка и развитие RAG-контура платформы
• Построение пайплайнов обработки данных: загрузка, предобработка, разбиение, индексация и поиск
• Разработка и оптимизация retrieval-логики: переранжирование, гибридный поиск, уточнение запросов
• Разработка агентных сценариев: управление tool calling, контроль выполнения и взаимодействие с внешними сервисами
• Интеграция LLM-моделей и inference-сервисов в прикладные системы
• Построение механизмов формирования ответов с опорой на источники (grounding, цитирование, проверка)
• Разработка и поддержка контуров оценки качества: тестовые наборы, сценарии, метрики
• Анализ и улучшение качества ответов на реальных данных
• Работа с корпоративными документами и неструктурированными источниками данных
Требования
• Уверенное владение Python
• Коммерческий опыт разработки от 4 лет
• Практический опыт работы с LLM, RAG и retrieval-системами
• Понимание полного цикла RAG: загрузка данных, предобработка, разбиение, эмбеддинги, индексация, поиск, переранжирование, оценка
• Опыт работы с векторным поиском или поисковыми пайплайнами
• Опыт улучшения качества поиска и ответов в production-системах
• Понимание ограничений LLM: задержки, нестабильность, галлюцинации, ограничение контекста
• Опыт интеграции LLM в backend-системы
• Опыт разработки агентных сценариев или систем с tool calling
• Опыт построения и использования метрик качества (offline/online evaluation)
• Умение оценивать и улучшать систему на основе данных
• Опыт работы с неструктурированными и “грязными” данными
Будет плюсом
• Опыт работы с LangChain, LangGraph или аналогичными фреймворками
• Опыт построения гибридного поиска (vector + keyword)
• Опыт работы с rerank-моделями и query rewriting
• Опыт работы с локальными моделями и inference-серверами (vLLM, TGI, KServe и др.)
• Опыт построения production RAG-систем
• Опыт работы с корпоративными базами знаний
• Опыт работы в ML/AI-инфраструктуре
• Понимание MLOps и model serving на уровне интеграции
Что важно для нас
• Системное понимание LLM и RAG как части архитектуры, а не набора инструментов
• Умение строить воспроизводимые, проверяемые и управляемые решения
• Умение работать с качеством: находить проблемы и улучшать систему на основе данных
• Умение принимать инженерные решения и нести за них ответственность
• Критическое мышление: понимание, где нужен агент, а где достаточно корректно спроектированного retrieval
BI.ZONE
Москва
Не указана
ГЕТ ЭКСПЕРТС РЕКРУТМЕНТ
Москва
Не указана
ФГАОУ ВО РОССИЙСКИЙ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ МЕДИЦИНСКИЙ УНИВЕРСИТЕТ им.Н.И. ПИРОГОВА МИНИСТЕРСТВА ЗДРАВООХРАНЕНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ
Москва
до 360000 RUR
Москва
до 360000 RUR