Инженер LLM / SRE (LLM-платформа)

МАТРИ

Инженер LLM / SRE (LLM-платформа)

Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 42с1

Метро: Баковка

Описание вакансии

О проекте
Локальная мультиагентная платформа для анализа бизнес‑процессов на основе LLM. Платформа развёртывается в инфраструктуре заказчика (on‑premise), интегрируется с корпоративными системами и масштабируется на новые бизнес‑случаи.

Наша задача — создать надёжную, управляемую и защищённую AI‑платформу, готовую к промышленной эксплуатации.

Кого мы ищем
Опытного инженера LLM / SRE, который сможет сочетать навыки backend‑разработки, работы с LLM и эксплуатации.

Вы будете отвечать за разработку мультиагентных сценариев, развёртывание локальных моделей, интеграции и обеспечение стабильной работы платформы.

Ключевые обязанности

  • Разработка, развёртывание и сопровождение мультиагентной архитектуры (агенты, маршрутизация, RAG‑конвейеры).
  • Проектирование и оптимизация промптов, систем контроля качества генерации и agent‑flows.
  • Развёртывание локальных LLM, управление версиями моделей и оптимизация inference.
  • Интеграция с корпоративными системами через REST/API, обеспечение безопасности передач данных.
  • Настройка CI/CD процессов для микросервисов (Docker, GitLab CI/GitHub Actions), автоматизация развёртываний и откатов.
  • Настройка мониторинга, логирования и алертинга (Prometheus, Grafana, Loki/ELK), сбор метрик качества генерации.
  • Участие в инцидент‑менеджменте, root cause analysis и повышении надёжности (SRE‑взаимодействия).
  • Подготовка документации, обучение внутренних команд и поддержка code review.

Требования (обязательные)

  • Python 3.10+ — уверенная разработка сервисов, знание async/await, практический опыт написания тестов.
  • Практический опыт работы с LLM / Generative AI: PoC или production‑проекты, ежедневное использование моделей в инженерной деятельности.
  • Опыт построения RAG‑pipeline и работы с фреймворками вроде LangChain / LlamaIndex / LangGraph.
  • Опыт развёртывания серверных приложений в Linux‑окружении.
  • Уверенное владение Docker и Docker Compose; базовые навыки оркестрации (Kubernetes).
  • Опыт интеграции через REST API, умение работать с корпоративными системами.
  • Готовность к работе on‑premise / гибридно; технический английский для чтения документации.

Желательные навыки (будут преимуществом)

  • Опыт эксплуатации AI‑инфраструктуры: управление моделями, настройка inference на CPU/GPU, оптимизация latency.
  • Опыт работы с векторными базами (Qdrant, Milvus, pgvector).
  • Навыки SRE/DevOps: Prometheus, Grafana, Loki/ELK, GitLab CI/GitHub Actions на production‑уровне.
  • Опыт работы с Yandex Cloud / Yandex AI Studio.
  • Опыт PostgreSQL, Redis, SQL.
  • Опыт в MLOps и управлении ML‑pipelines.

Опыт

  • Коммерческий опыт разработки: от 2 лет (или эквивалентные проекты/портфолио).
  • Практический опыт с LLM/GenAI: от 1 года (PoC или production).
  • Docker/Linux/развёртывание серверных приложений: от 1 года.

Примеры реальных задач

  • Свернуть RAG‑pipeline по корпоративной документации, снизив latency и сохранив точность поиска.
  • Настроить CI/CD процесс для обновления локальной модели с автоматическим откатом при регрессе.
  • Построить метрики качества генерации и интегрировать мониторинг с алертами при деградации.

Soft skills и культура

  • Умение формализовать требования и коммуницировать с заказчиком.
  • Самостоятельность, ответственность за участок платформы, умение приоритизировать задачи.
  • Готовность к командной работе в кросс‑функциональной команде инженеров и ML‑research.

Условия работы

  • Формат: on‑premise / гибрид (точный режим обсуждается на собеседовании).
  • Проектная занятость (+/-6 месяцев).
  • Команда: компактная команда инженеров и ML‑research.
  • Конкурентная оплата.

Как откликнуться
В сопроводительном письме, пожалуйста, опишите кратко один проект с LLM: цель, стек, ваша роль, результат (включая метрики, если есть).

Навыки
  • PostgreSQL
  • Grafana
  • Python
  • Docker
  • FastAPI
  • REST API
  • pandas
  • Pytest
  • PROMT
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Пахомов Алексей Юрьевич
  • Москва

  • до 250000 RUR

Рекомендуем
Богомолов Константин Николаевич

ML-инженер

Богомолов Константин Николаевич

  • Москва

  • до 250000 RUR

Рекомендуем
Volna.tech
  • Москва

  • до 260000 RUR

Jobers
  • Москва

  • до 160000 RUR

Защищенные Телекоммуникации

Application Security Engineer / AppSec

Защищенные Телекоммуникации

  • Москва

  • до 160000 RUR

Инфосистемы Джет
  • Москва

  • до 160000 RUR

Работай в авиации

Инженер-конструктор СЭС

Работай в авиации

  • Москва

  • от 150000 RUR

Эколайн
  • Москва

  • до 250000 RUR

Сэнсэй
  • Москва

  • до 300000 RUR

SSP SOFT
  • Москва

  • до 300000 RUR

БТЕ
  • Москва

  • от 160000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию