Москва
Глубокое понимание принципов SRE и DevOps: SLO/SLA/SLI, инцидент-менеджмент, postmortem-процессы, устранение toil. Опыт с Kubernetes и контейнеризацией...
Определяет и внедряет SLO/SLA/SLI для сервисов продукта. Реагирует на инциденты, проводит постмортемы и анализирует причины сбоев (root cause...