выявление отклонений в работе сервиса, их фиксация, локализация и регистрация задач на устранение;
выявление и локализация функциональных дефектов, определение массовости, определение приоритета, выработка обходного решения;
выполнение настроек мониторинга (Grafana, ESM), локализация и регистрация дефектов, а также участие в их решении;
формирование требований направленных на стабилизацию работы системы, повышения отказоустойчивости по итогу выявленных отклонений в работе сервиса на ранней стадии, зонтичных проблем, аварий.
Требования:
высшее образование;
понимание принципа работы микросервисной архитектуры и контейнеризации (OpenShift/k8s/Kubernetes) (опыт работы от года);
знание средств мониторинга и сбора логов Kibana, Grafana, Zabbix (опыт работы от года);
опыт работы администрирования Linux от года;
опыт проведения работ по внедрению поставок на тестовые контура, прод в части исправления дефектов, новой функциональности, интеграционных релизов;
участие и курирование аварий на тестовых контурах, прод-сегментах, выявление влияния.