Управление эксплуатации - команда создает отказоустойчивую инфраструктуру для умных устройств и высоконагруженных систем. У нас много классных сервисов, которые доступны нашим клиентам 24/7.
Обязанности
- внедрение и сопровождение высоконагруженных ML сервисов
- создание тестовых сред (VM, OpenShift, GPU)
- решение задач по повышению надежности и доступности IT систем
- решение инцидентов, анализ причин их возникновения
- применение методологии и инструментов DevOps в работе (BitBucket, Ansible, Jenkins, GitLab)
- настройка систем мониторинга и логирования (Zabbix, Grafana, ELK).
Требования
- уверенные знания и навыки Linux, Network
- опыт внедрения и сопровождения IT систем
- опыт работы с OpenShift/Kubernetes
- опыт работы с системами мониторинга и логирования (Zabbix, Grafana, ELK)
- опыт работы с Nginx, Kafka
- опыт автоматизации на Python / Bash
- опыт работы и понимание методологии DevOps.
Будет плюсом опыт работы со следующими технологиями:
- оптимизация работы GPU серверов
- знания и навыки работы с облачными платформами и технологиями.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы (2-3 дня в неделю офис)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.