Мы находимся в поиске NOC-инженера для работы в нашем центре мониторинга и реагирования. Хотим, чтобы наш сервис работал стабильно и радовал наших клиентов 24/7, вне зависимости от часового пояса.
Чем предстоит заниматься:
- обрабатывать входящие запросы и оповещения от систем мониторинга, самостоятельно решать и локализовывать проблемы при наличии runbook и необходимых компетенций (либо координировать работы по их устранению);
- проактивно мониторить работоспособность и состояние инфраструктуры, включая сетевые компоненты, серверы, приложения и отдельные компоненты системы;
- контролировать соблюдения SLA (соглашение об уровне обслуживания);
- определять проблемные участки и работать с on-call дежурными — Developers, SRE, DevOps;
- координировать процесс ведения инцидента.
Мы рассчитываем, что ты:
- готов работать в сменном графике 2/2/3 12:00-00:00 (Мск);
- имеешь опыт работы от 2 лет в ролях NOC-инженера / дежурного сисадмина / инцидент-менеджера / системного администратора Linux / DevOps;
- понимаешь процессы ITIL Incident, Problem, and Change Management;
- понимаешь, что такое облачная инфраструктура и контейнеры;
- умеешь пользоваться инструментами мониторинга (Grafana, APM, Elastic stack, системы трейсинга);
- развиваешь ops компетенции и экспертизу для оперативного исправления инцидентов.
Что мы предлагаем:
Мы аккредитованная IT-компания с сопутствующими преимуществами. ДМС и страховка, разнообразное обучение, оплата участия в конференциях, скидки от партнеров и все классические плюшки.