В Управление эксплуатации ищем SRE инженера для сопровождения АС GigaChat.
Обязанности
- внедрение и сопровождение высоконагруженных ML сервисов
- создание промышленных и тестовых сред (VM, OpenShift, GPU)
- решение задач по повышению надежности и доступности IT систем
- решение инцидентов, анализ причин их возникновения
- применение методологии и инструментов DevOps в работе (BitBucket, Ansible, Jenkins, GitLab)
- настройка, развитие систем мониторинга и логирования (Zabbix, Grafana, ELK)
- автоматизация рутинных задач Python.
Требования
- уверенные знания и навыки: Linux, Network
- опыт внедрения и сопровождения промышленных IT систем
- построение и эксплуатация инфраструктуры для ML моделей
- опыт работы с OpenShift/Kubernetes
- опыт работы с системами мониторинга и логирования (Zabbix, Grafana, ELK)
- опыт работы с БД (Mongo, PostgreSQL, ClickHouse)
- опыт работы с Nginx, Kafka, Haproxy
- опыт автоматизации на Python / Bash
- опыт работы и понимание методологии DevOps.
Будет плюсом опыт работы со следующими технологиями:
- оптимизация работы GPU серверов
- промышленная разработка на Python
- знания и навыки работы с облачными платформами и технологиями
- понимание архитектуры и работы LLM, опыт разработки AI-агентов.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы (2-3 дня в неделю офис)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера