Планировать работу 24/7 дежурной смены мониторинга: формировать графики дежурств, организовывать замещение сотрудников, распределять зоны ответственности между специалистами смены
Обеспечивать выполнение регламентов и стандартов работы дежурной смены
Контролировать качество обработки событий мониторинга, алертов и инцидентов
Проводить регулярные встречи 1-1 с сотрудниками смены, оценивать результаты работы и формировать планы развития
Организовывать адаптацию и первичное обучение новых сотрудников
Блок инцидентов:
Координировать взаимодействие между командами поддержки, эксплуатации и разработки в процессе устранения инцидентов
Участвовать в расследовании крупных инцидентов и аварийных ситуаций
Контролировать соблюдение SLA и корректность маршрутизации инцидентов между разными группами администраторов
Участвовать в подготовке разборов инцидентов (post-mortem) и разработке мероприятий по предотвращению повторных случаев
Участвовать в развитии и совершенствовании процессов мониторинга совместно с инженерами мониторинга и архитекторами
Анализировать качество мониторинга и инициировать мероприятия по снижению количества ложных срабатываний и повышению эффективности обнаружения инцидентов
Что мы ожидаем:
Опыт работы в мониторинге, технической поддержке, эксплуатации или сопровождении ИТ-инфраструктуры от 2 лет
Практические навыки работы с системами мониторинга и наблюдаемости (Zabbix, Grafana, GMonit или аналоги)
Опыт работы с системами управления инцидентами и сервис-деск платформами (ServiceNow, Jira, Altevics, Naumen или аналоги)
Понимание процессов управления инцидентами и взаимодействия между линиями поддержки
Опыт разработки или описания операционных процессов и регламентов, написание ранбуков/ инструкций для дежурных администраторов
Навыки проведения 1-1 встреч, предоставления обратной связи и развития сотрудников
Будет плюсом:
Опыт работы в круглосуточной поддержке критичных бизнес-сервисов