Site Reliability Engineer ( Инженер по надежности сайта )

Site Reliability Engineer ( Инженер по надежности сайта )

Москва, Барабанный переулок, 4с3

Метро: Электрозаводская

Описание вакансии

HOSTKEY ищет Site Reliability Engineer (SRE), который возьмёт на себя надежность сложной инфраструктуры. Нам нужен инженер, способный не просто реагировать на сбои, а выстраивать систему так, чтобы их предотвращать: от внедрения SLI/SLO до глубокой отладки сети внутри Kubernetes. Вы будете тем человеком, который сделает мониторинг прозрачным от фронтенда до очереди RabbitMQ, а деплой - бесшовным для тысяч WebSocket соединений.

Основные задачи:

  • Внедрение SLI/SLO, управление инцидентами, участие в on-call ротации, проведение постмортемов.

  • Построение сквозного мониторинга цепочки Фронт → Бэк → Очередь → WebSocket. Стек: VictoriaMetrics + Grafana + Sentry.

  • Глубокая работа с Kubernetes (сетевые политики, лимиты, отладка подов).

  • Продвинутая настройка Nginx под долгоживущие WebSocket-соединения.

  • Администрирование MinIO в Distributed Mode (Erasure Coding, обновления без простоя).

  • Тюнинг производительности MariaDB / ClickHouse / Redis (индексы, тяжелые запросы, репликация).

  • Эксплуатация RabbitMQ: кластеризация, мониторинг лагов, ретеншн.

  • Развитие GitLab CI/CD (сложные пайплайны, канареечные деплои, blue/green).

  • Участие в миграции PHP-приложения с php-fpm на persistent runtime (RoadRunner / FrankenPHP).

Требования:

  • Опыт SRE/DevOps от 3 лет в production-среде с реальной нагрузкой.

  • Kubernetes не на уровне kubectl apply, а с пониманием сетевых политик и отладки проблем.

  • Nginx: уверенное проксирование WebSocket-трафика и балансировка долгих соединений.

  • Уверенный Linux: tcpdump, strace, анализ сетевой подсистемы.

  • Опыт работы с очередями (RabbitMQ / Kafka).

  • Опыт администрирования объектных хранилищ (MinIO / Ceph).

  • Понимание ограничений классического php-fpm и готовность работать с современными рантаймами (RoadRunner, FrankenPHP).

Мы предлагаем:

  • Полноценная удаленная работа из любой точки мира.

  • Работа в аккредитованной IT-компании.

  • Полный день 10:00–19:00 МСК, 5/2 (гибкое начало рабочего дня).

  • Интересные высоконагруженные задачи и дружный профессиональный коллектив.

Посмотреть контакты работодателя

Адрес

Похожие вакансии

RWB (Wildberries & Russ)
  • Москва

  • Не указана

Рекомендуем
Production IT

DevOps-инженер

Production IT

  • Москва

  • до 300000 RUR

Рекомендуем
SIMUSHKA Distribution & Academy

DevOps-инженер (middle, middle+)

SIMUSHKA Distribution & Academy

  • Москва

  • от 250000 RUR

ГКУ Инфогород

Инженер мониторинга

ГКУ Инфогород

  • Москва

  • от 250000 RUR

DevOps Engineer

Харанутов Антон Евгеньевич

  • Москва

  • от 3000 USD

Мобайл Парк

DevOps-инженер

Мобайл Парк

  • Москва

  • до 290000 RUR

Альфа-Банк
  • Москва

  • до 290000 RUR

Финфрейм

Инженер ИБ (AppSec)

Финфрейм

  • Москва

  • до 290000 RUR

Национальная Лотерея

DevOps-инженер в Data platform

Национальная Лотерея

  • Москва

  • до 290000 RUR

DatsTeam
  • Москва

  • до 290000 RUR

Ит-Финанс

DevOps-инженер (DWH)

Ит-Финанс

  • Москва

  • до 290000 RUR

Флант
  • Москва

  • до 290000 RUR

Амбрелла
  • Москва

  • до 290000 RUR

Ростелеком Информационные Технологии

DevOps/MLOps инженер

Ростелеком Информационные Технологии

  • Москва

  • до 290000 RUR

edna
  • Москва

  • до 290000 RUR

edna
  • Москва

  • до 290000 RUR

Киберпротект
  • Москва

  • до 290000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию