Москва
Глубокое понимание инфраструктуры и подхода SRE (SLI, SLO, SLA, управление инцидентами, постмортемы, автоматизация восстановления, проактивное выявление сбоев). Опыт проектирования и...
Контроль стабильности и доступности production-среды. Оперативное устранение инцидентов, влияющих на работоспособность прода. Проектирование, настройка и сопровождение отказоустойчивой, масштабируемой и...