Обязанности
Мониторинг и контроль
- Круглосуточный мониторинг состояния инфраструктуры, сервисов и business-critical систем по дашбордам и алертам (Zabbix, Prometheus/VictoriaMetrics, Grafana, SCOM).
- Анализ трендов и превентивное реагирование на деградацию сервисов до перехода в инцидент.
Инциденты
- Самостоятельное решение инцидентов уровня P2/P3 по runbook'ам без ожидания дневной смены.
- Реагирование на инциденты P1 с координацией эскалации на старшего инженера / архитектора / вендора.
- Ведение инцидентов в тикет-системе, post-mortem по согласованию с руководителем.
Эксплуатация инфраструктуры
- Администрирование серверных ОС Windows и Linux (RHEL, CentOS, Ubuntu, Astra Linux SE) в рамках эксплуатационных задач: сервисы, патчи (по регламенту), логи, диски, сеть.
- Администрирование серверов виртуализации (Hyper-V или VMware vSphere) — управление ВМ, контроль кластера, базовая диагностика.
- Контроль и диагностика СУБД (MSSQL и/или PostgreSQL): проверка состояния, базовые запросы, эскалация при необходимости глубокого вмешательства.
- Контроль резервного копирования: статус заданий, восстановление по утверждённым инструкциям.
- Администрирование систем мониторинга (Zabbix, Prometheus/Grafana) — настройка алертов, дашбордов в рамках смены.
Типовые и регламентные задачи
- Выполнение регламентных работ по чек-листам: перезапуск сервисов, контроль ресурсов, ротация логов.
- Выполнение и адаптация готовых скриптов на bash / PowerShell по инструкциям.
- Базовая диагностика middleware (Nginx, Redis, IIS, File Server) — перезапуск, анализ логов, эскалация при необходимости.
Коммуникация и документирование
- Информирование заинтересованных сторон по регламенту.
- Фиксация всех действий в смене, актуализация runbook'ов.
- Координация с дневной командой при передаче смены.
Требования
- Опыт работы от 3 до 5 лет в эксплуатации серверной инфраструктуры или системном администрировании.
- Администрирование Windows Server и Linux в production-среде.
- Опыт работы с системой мониторинга (Zabbix, Prometheus/Grafana или VictoriaMetrics).
- Администрирование виртуализации (Hyper-V или VMware vSphere), включая базовую работу с кластером.
- Опыт с СУБД (MSSQL или PostgreSQL) на уровне диагностики и эксплуатационных задач.
- Навыки написания и адаптации скриптов на bash или PowerShell.
- Опыт самостоятельного решения инцидентов в production-среде.
- Готовность к сменному графику 1/3.
- Ответственность, стрессоустойчивость, умение принимать решения в условиях давления, дисциплина документирования, обучаемость.
Будет плюсом
- Опыт дежурств / сменной работы в NOC, ЦОД на business-critical системах.
- Администрирование SCOM, VictoriaMetrics.
- Опыт с SAN/СХД, Kafka, Redis, Ceph, Apache Airflow, BIND.
- Опыт с несколькими гипервизорами (Hyper-V + VMware, ProVZ, Proxmox VE, Альт PVE).
- Опыт автоматизации рутинных операций.
- Знание английского языка на уровне чтения профессиональной литературы.
- Высшее техническое образование.
- Сертификаты (MCSA, Linux+, VMware VCP и аналоги).
Условия
- Работа в крупном системном интеграторе, с большим количеством различных задач.
- Удобное расположение офиса: шаговая доступность от ст. м. Белорусская — 5–7 минут пешком.
- Официальная заработная плата.
- График работы — сменный 1/3.
- Оформление по ТК РФ с первого рабочего дня.
- Оплата проезда по Москве.