Site Reliability Engineer ( Инженер по надежности сайта )

Site Reliability Engineer ( Инженер по надежности сайта )

Москва, Барабанный переулок, 4с3

Метро: Электрозаводская

Описание вакансии

HOSTKEY ​​​​​​​ищет Site Reliability Engineer (SRE), который возьмёт на себя надежность сложной инфраструктуры. Нам нужен инженер, способный не просто реагировать на сбои, а выстраивать систему так, чтобы их предотвращать: от внедрения SLI/SLO до глубокой отладки сети внутри Kubernetes. Вы будете тем человеком, который сделает мониторинг прозрачным от фронтенда до очереди RabbitMQ, а деплой - бесшовным для тысяч WebSocket соединений.

Основные задачи:

  • Внедрение SLI/SLO, управление инцидентами, участие в on-call ротации, проведение постмортемов.

  • Построение сквозного мониторинга цепочки Фронт → Бэк → Очередь → WebSocket. Стек: VictoriaMetrics + Grafana + Sentry.

  • Глубокая работа с Kubernetes (сетевые политики, лимиты, отладка подов).

  • Продвинутая настройка Nginx под долгоживущие WebSocket-соединения.

  • Администрирование MinIO в Distributed Mode (Erasure Coding, обновления без простоя).

  • Тюнинг производительности MariaDB / ClickHouse / Redis (индексы, тяжелые запросы, репликация).

  • Эксплуатация RabbitMQ: кластеризация, мониторинг лагов, ретеншн.

  • Развитие GitLab CI/CD (сложные пайплайны, канареечные деплои, blue/green).

  • Участие в миграции PHP-приложения с php-fpm на persistent runtime (RoadRunner / FrankenPHP).

Требования:

  • Опыт SRE/DevOps от 3 лет в production-среде с реальной нагрузкой.

  • Kubernetes не на уровне kubectl apply, а с пониманием сетевых политик и отладки проблем.

  • Nginx: уверенное проксирование WebSocket-трафика и балансировка долгих соединений.

  • Уверенный Linux: tcpdump, strace, анализ сетевой подсистемы.

  • Опыт работы с очередями (RabbitMQ / Kafka).

  • Опыт администрирования объектных хранилищ (MinIO / Ceph).

  • Понимание ограничений классического php-fpm и готовность работать с современными рантаймами (RoadRunner, FrankenPHP).

Мы предлагаем:

  • Полноценная удаленная работа из любой точки мира.

  • Работа в аккредитованной IT-компании.

  • Полный день 10:00–19:00 МСК, 5/2 (гибкое начало рабочего дня).

  • Интересные высоконагруженные задачи и дружный профессиональный коллектив.

Навыки
  • PHP
  • Golang
Посмотреть контакты работодателя

Адрес

Похожие вакансии

DatsTeam
  • Москва

  • Не указана

Рекомендуем
RWB (Wildberries & Russ)

SRE / DevOps-инженер

RWB (Wildberries & Russ)

  • Москва

  • Не указана

Рекомендуем
BI.ZONE
  • Москва

  • до 350000 RUR

DatsTeam
  • Москва

  • до 350000 RUR

ТЛ Групп

Platform Engineer / SRE

ТЛ Групп

  • Москва

  • до 350000 RUR

Цитадель
  • Москва

  • до 350000 RUR

Таймвэб.Клауд

Ведущий инженер ИБ

Таймвэб.Клауд

  • Москва

  • до 350000 RUR

METRO Россия
  • Москва

  • до 350000 RUR

Devhunt
  • Москва

  • до 250000 RUR

Т1
  • Москва

  • до 250000 RUR

Флант
  • Москва

  • до 250000 RUR

RWB (Wildberries & Russ)

DevOps-инженер

RWB (Wildberries & Russ)

  • Москва

  • до 250000 RUR

РТК-ЦОД
  • Москва

  • до 250000 RUR

edna
  • Москва

  • до 250000 RUR

РДП Энтерпрайз

Senior NetDevOps-инженер

РДП Энтерпрайз

  • Москва

  • до 250000 RUR

edna
  • Москва

  • до 250000 RUR

ВиаМоби

DevOps-инженер

ВиаМоби

  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию