Старший дежурный инженер инфраструктуры (ЦОД)

Москва, Миусская площадь, 3с4

Описание вакансии

Обязанности

Мониторинг и контроль

Круглосуточный мониторинг состояния инфраструктуры, сервисов и business-critical систем по дашбордам и алертам (Zabbix, Prometheus/VictoriaMetrics, Grafana, SCOM).
Анализ трендов и превентивное реагирование на деградацию сервисов до перехода в инцидент.

Инциденты

Самостоятельное решение инцидентов уровня P2/P3 по runbook'ам без ожидания дневной смены.
Реагирование на инциденты P1 с координацией эскалации на старшего инженера / архитектора / вендора.
Ведение инцидентов в тикет-системе, post-mortem по согласованию с руководителем.

Эксплуатация инфраструктуры

Администрирование серверных ОС Windows и Linux (RHEL, CentOS, Ubuntu, Astra Linux SE) в рамках эксплуатационных задач: сервисы, патчи (по регламенту), логи, диски, сеть.
Администрирование серверов виртуализации (Hyper-V или VMware vSphere) — управление ВМ, контроль кластера, базовая диагностика.
Контроль и диагностика СУБД (MSSQL и/или PostgreSQL): проверка состояния, базовые запросы, эскалация при необходимости глубокого вмешательства.
Контроль резервного копирования: статус заданий, восстановление по утверждённым инструкциям.
Администрирование систем мониторинга (Zabbix, Prometheus/Grafana) — настройка алертов, дашбордов в рамках смены.

Типовые и регламентные задачи

Выполнение регламентных работ по чек-листам: перезапуск сервисов, контроль ресурсов, ротация логов.
Выполнение и адаптация готовых скриптов на bash / PowerShell по инструкциям.
Базовая диагностика middleware (Nginx, Redis, IIS, File Server) — перезапуск, анализ логов, эскалация при необходимости.

Коммуникация и документирование

Требования

Опыт работы от 3 до 5 лет в эксплуатации серверной инфраструктуры или системном администрировании.
Администрирование Windows Server и Linux в production-среде.
Опыт работы с системой мониторинга (Zabbix, Prometheus/Grafana или VictoriaMetrics).
Администрирование виртуализации (Hyper-V или VMware vSphere), включая базовую работу с кластером.
Опыт с СУБД (MSSQL или PostgreSQL) на уровне диагностики и эксплуатационных задач.
Навыки написания и адаптации скриптов на bash или PowerShell.
Опыт самостоятельного решения инцидентов в production-среде.
Готовность к сменному графику 1/3.
Ответственность, стрессоустойчивость, умение принимать решения в условиях давления, дисциплина документирования, обучаемость.

Будет плюсом

Опыт дежурств / сменной работы в NOC, ЦОД на business-critical системах.
Администрирование SCOM, VictoriaMetrics.
Опыт с SAN/СХД, Kafka, Redis, Ceph, Apache Airflow, BIND.
Опыт с несколькими гипервизорами (Hyper-V + VMware, ProVZ, Proxmox VE, Альт PVE).
Опыт автоматизации рутинных операций.
Знание английского языка на уровне чтения профессиональной литературы.
Высшее техническое образование.
Сертификаты (MCSA, Linux+, VMware VCP и аналоги).

Условия

Работа в крупном системном интеграторе, с большим количеством различных задач.
Удобное расположение офиса: шаговая доступность от ст. м. Белорусская — 5–7 минут пешком.
Официальная заработная плата.
График работы — сменный 1/3.
Оформление по ТК РФ с первого рабочего дня.
Оплата проезда по Москве.

Посмотреть контакты работодателя