Senior DevOps LLM (Investment banking platform)

СБЕР

Senior DevOps LLM (Investment banking platform)

Описание вакансии

Информация о проекте:

Хотите изменить свою жизнь и стать частью команды, которая создает будущее инвестиционной индустрии? Тогда присоединяйтесь к нам!

Мы разрабатываем систему, которая автоматизирует весь жизненный цикл инвестиционной сделки. Наши команды работают над следующими направлениями:

  • Алгоритмизированный и AI поиск потенциальных сделок и клиентов;
  • Управление процессом заключения инвестиционных сделок;
  • Финансовые расчеты и оценка портфеля;
  • Построение финансовой и управленческой отчетности по портфелю инвестиций Сбера;
  • Инвестиционные сервисы для компаний - наших клиентов.

Обязанности

Запуск и настройка инфраструктуры инференса (LLM Inference):

  • развертывание и конфигурация Open Source LLM (DeepSeek, Qwen и др.) на собственных мощностях
  • настройка высокопроизводительных инференс-серверов (vLLM, TGI, TensorRT-LLM, llama.cpp)
  • оптимизация использования GPU (память, батчинг, quantization) для достижения требуемой пропускной способности и задержек (latency).

Мониторинг инфраструктуры инференса:

  • настройка систем observability для слоя инференса: сбор метрик (количество запросов, время генерации, использование VRAM, throughput, количество активных потоков/запросов)
  • реализация health checks (ready/live probes) для инференс-серверов
  • автоматизация оповещений (alerts) при деградации производительности или падении сервисов.

Мониторинг работы агентов:

  • настраивать сквозную трассировку (trace_id) по всей цепочке сервисов: от пользовательского интерфейса до агентов и инфраструктуры
  • развивать дашборды в Grafana для мониторинга агентов, инфраструктуры и ключевых компонентов платформы
  • внедрять кастомные метрики для агентов (запросы, статус, P95, LLM-вызовы, токены) без изменения кода агентов
  • обеспечивать корреляцию логов и трейсов для быстрого поиска инцидентов
  • настраивать алерты: технические (Pod OOM, память, ошибки) и качественные (satisfaction rate, регрессии).
  • Работать с централизованным Prompt Hub для хранения и обновления промптов без деплоя
  • автоматизировать интеграцию E2E-тестов с системой трассировки.

Развертывание серверной инфраструктуры

  • поднятие и конфигурация бэкенд-серверов для работы агентов (FastAPI, Node.js или других runtime)
  • контейнеризация (Docker) и оркестрация (Kubernetes / Docker Compose) компонентов системы
  • управление окружениями (dev/stage/prod) и CI/CD пайплайнами для доставки кода агентов и обновлений инфраструктуры.

Написание агентов (Harness Engineering):

  • разработка агентов в структурированном формате Markdown, следуя принципам Claude/Harness Engineering (явное описание инструментов, контекста, последовательности действий)
  • создание системных промптов, определения инструментов (tools/functions) и четких границ поведения агента
  • интеграция агентов с внешними API, базами данных и DevOps-инструментами (Kubernetes, AWS, CI/CD).

Автоматизация процессов сборки, тестирования и развёртывания ПО:

  • разработка и поддержка пайплайнов CI/CD
  • внедрение новых инструментов для автоматизации и мониторинга
  • взаимодействие с командами разработки, тестирования и эксплуатации.

Требования

  • опыт развертывания и сопровождения Open Source LLM в продакшене
  • глубокое практическое знание инструментов инференса: vLLM, TGI (Text Generation Inference) или аналогичных (TensorRT-LLM, sglang)
  • понимание внутренних механизмов LLM инференса: KV-cache, continuous batching, quantization (GGUF, GPTQ, AWQ)
  • опыт написания агентов/промптов в продакшн-среде, знакомство с концепцией Harness Engineering (или готовность быстро в нее погрузиться)
  • уверенное владение Python (написание сервисов, скриптов мониторинга, интеграций)
  • экспертный опыт работы с контейнеризацией (Docker)
  • опыт управления кластерами Kubernetes: написание и поддержка манифестов, работа с Helm (чарты)
  • опыт построения и поддержки пайплайнов в Jenkins, GitLab CI
  • уверенная работа с Git (стратегии ветвления, код-ревью)
  • опыт работы с СУБД (PostgreSQL, ClickHouse или аналогичными) в контексте высоконагруженных систем
  • опыт построения observability-стека для микросервисных или агентных систем
  • навыки настройки сквозной трассировки, метрик, логирования и алертинга
  • уверенное владение инструментами: Grafana, Prometheus, Loki, Jaeger, OpenTelemetry.

Условия

  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
  • Москва

  • Не указана

Рекомендуем
ПЕТЕР-СЕРВИС Спецтехнологии

Senior DevOps / SRE Engineer

ПЕТЕР-СЕРВИС Спецтехнологии

  • Москва

  • Не указана

Рекомендуем
FunFlow (ООО Мобильные Игровые Решения)

DevOps-инженер

FunFlow (ООО Мобильные Игровые Решения)

  • Москва

  • Не указана

Рекомендуем
RUTUBE
  • Москва

  • Не указана

ГКУ Инфогород

DevOps-инженер

ГКУ Инфогород

  • Москва

  • Не указана

ГКУ Инфогород

DBA/DevOps-специалист

ГКУ Инфогород

  • Москва

  • Не указана

Web3 Tech
  • Москва

  • Не указана

ИТ-Экспертиза
  • Москва

  • Не указана

ГК «МТ-Интеграция»

Старший DevOps-инженер (Openstack)

ГК «МТ-Интеграция»

  • Москва

  • Не указана

Криптонит

Lead SRE (ЦОД)

Криптонит

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СТЭП ЛОДЖИК (STEP LOGIC)

DevOps инженер

СТЭП ЛОДЖИК (STEP LOGIC)

  • Москва

  • Не указана

СБЕР

DevOps (Sber.DS)

СБЕР

  • Москва

  • Не указана

Senior Linux инженер (GigaChat Enterprise)

Салют для Бизнеса

  • Москва

  • Не указана

РДП Энтерпрайз

Tech Lead (телеком)

РДП Энтерпрайз

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Яндекс
  • Москва

  • Не указана

ИТ-Экспертиза
  • Москва

  • Не указана

Team Lead FullStack

ВТБ Специализированный депозитарий

  • Москва

  • Не указана

ФГУП ЦРП
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию