Мы ищем специалиста, который станет ключевым звеном в обеспечении стабильности и доступности наших ИТ-сервисов.
Если вы умеете быстро реагировать, разбираться в технических деталях и хотите развиваться в направлении SRE/NOC — мы будем рады видеть вас в команде.
Что необходимо будет делать:
- Мониторинг серверов, сетей и критичных ИТ-систем в режиме 24/7;
- Оперативное выявление и первичная диагностика инцидентов, запуск скриптов;
- Эскалация по матрице ответственности, контроль до полного восстановления сервиса;
- Ведение инцидентов в ITSM: регистрация, категоризация, приоритезация, обновление статусов;
- Проведение health-checks, контроль SLA, актуализация дашбордов и виджетов;
- Поддержание сменной документации: отчёты, журнал ошибок;
- Актуализация инструкций, предложения по улучшению мониторинга; Подготовка отчётности по запросу руководителя.
- Соблюдение регламентов оповещения и эскалации.
Что мы ожидаем от кандидата:
- Опыт от 1–2 лет в эксплуатации, мониторинге, NOC или SRE;
- Знание Linux и Windows на базовом уровне: службы, логи, права, сеть, командная строка;
- Понимание сетевых протоколов: TCP/IP, DNS, HTTP(S), ICMP;
- Навыки работы с инструментами мониторинга: Zabbix (желательно), Grafana, APM-системы;
- Знание ITIL-подхода: Incident, Major Incident, Problem;
- Умение читать логи, писать простые SQL-запросы;
- Внимательность к деталям, грамотная письменная коммуникация.
Будет преимуществом:
- Скрипты bash/PowerShell, регулярные выражения;
- Знание БД (PostgreSQL/Oracle/MS SQL);
- Опыт в банковской или финтех-среде.
Что мы предлагаем:
- Сменный график 24/7 (дневная, вечерняя, ночная смены, 2 дня выходных).
- Дежурства по расписанию, работа в службе RUN;
- Добровольное медицинское страхование (ДМС) — заботимся о вашем здоровье;
- Возможности для профессионального и личностного роста: участие в обучающих программах, тренингах и мастер-классах.
Пожалуйста, в сопроводительном письме укажите свои зарплатные ожидания, спасибо!