SRE - инженер по обеспечению надёжности инфраструктуры

SRE - инженер по обеспечению надёжности инфраструктуры

Москва, Павелецкая набережная

Метро: Тульская

Описание вакансии

Ищем Site Reliability Engineer (SRE)


Вы будете заниматься поддержкой, эволюцией и наблюдаемостью legacy-инфраструктуры на Rancher 1.6, IPsec mesh и HAProxy.


Мы ищем человека, который пишет инструменты сам, глубоко понимает сети и готов разбираться в low-level проблемах (DNS, перезагрузка балансировщиков, туннели).


Задачи:


· Поддержка и развитие инфраструктуры на Rancher 1.6 (контейнеризация, управление окружениями)

· Работа с IPsec mesh и overlay-сетями — диагностика, оптимизация, отказоустойчивость

· Настройка и тюнинг HAProxy (L4/L7) в связке с контейнерной средой

· Разработка инструментов автоматизации и наблюдаемости на Python

· Построение мониторинга на Prometheus: кастомные метрики, алерты, сбор данных с legacy-компонентов

· Troubleshooting production-инцидентов без готовых алертов

· Работа с сопутствующими сервисами: PostgreSQL, RabbitMQ

· Написание документации и runbook’ов для типовых проблем


Требования (обязательно):


· Опыт в DevOps / SRE от 4 лет

· Docker на практике — уверенная работа с контейнерами

· HAProxy или аналогичные L7/L4 балансировщики (настройка, релоады, debugging)

· Prometheus — не только базовые метрики, но и написание кастомных экспортеров/метрик

· Глубокое понимание сетей: TCP/IP, VPN (особенно IPsec), overlay, маршрутизация

· Опыт реального troubleshooting production-инцидентов

· Умение писать код на Python для автоматизации, мониторинга, вспомогательных инструментов

· Опыт работы с нестандартной / legacy инфраструктурой

· Готовность разбираться в low-level проблемах (сеть, DNS, механика перезагрузки HAProxy, Rancher 1.6)


Желательно / будет плюсом:


· Опыт с Rancher 1.x

· PostgreSQL и RabbitMQ (диагностика, мониторинг)

· Опыт построения mesh / cluster-мониторинга


Мы предлагаем:


· Реальные задачи с высокой инженерной сложностью

· Минимум бюрократии — максимум самостоятельности

· Возможность влиять на архитектуру наблюдаемости и надёжности

· Заработную плату в зависимости от уровня от 250 000 до 400 000 гросс руб.

Навыки
  • сетевые технологии
  • развитие инфраструктуры
  • поддержка инфраструктуры
  • Rancher
  • IPsec mesh
  • HAProxy
  • Python
  • Prometheus
  • PostgreSQL
  • RabbitMQ
  • Docker
  • TCP/IP
  • troubleshooting production инцидентов
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Playerok
  • Москва

  • от 300000 RUR

Рекомендуем
Absolut POS

DevOps Engineer

Absolut POS

  • Москва

  • от 350000 RUR

Рекомендуем

Infrastructure Team Lead

СКАЙФОРТ РУС

  • Москва

  • до 350000 RUR

Рекомендуем
Bell Integrator

Инженер SRE/DevOps

Bell Integrator

  • Москва

  • до 350000 RUR

Bell Integrator
  • Москва

  • до 350000 RUR

РТЛабс
  • Москва

  • до 350000 RUR

RWB (Wildberries & Russ)

SOC Engineer (SIEM)

RWB (Wildberries & Russ)

  • Москва

  • до 350000 RUR

Cloud.ru
  • Москва

  • до 350000 RUR

Employcity
  • Москва

  • до 350000 RUR

Защищенные Телекоммуникации

Ведущий сетевой инженер

Защищенные Телекоммуникации

  • Москва

  • до 350000 RUR

Data World
  • Москва

  • до 250000 RUR

Bell Integrator
  • Москва

  • до 250000 RUR

Xello
  • Москва

  • до 250000 RUR

edna
  • Москва

  • до 250000 RUR

ПОРТАЛ сеть робот-моек

DevOps Engineer

ПОРТАЛ сеть робот-моек

  • Москва

  • до 250000 RUR

ДИСИ ИНЖИНИРИНГ

Ведущий сетевой инженер

ДИСИ ИНЖИНИРИНГ

  • Москва

  • до 300000 RUR

ГКУ Инфогород

DevOps-инженер (Senior)

ГКУ Инфогород

  • Москва

  • до 300000 RUR

Стрит Фалькон

Middle DevOps инженер

Стрит Фалькон

  • Москва

  • до 300000 RUR

iiko, Компания Айко
  • Москва

  • от 230000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию