Senior DevOps Engineer

Описание вакансии

Мы ищем Senior DevOps инженера в инфраструктурную команду для развития и поддержки высоконагруженных сервисов и внутренних платформ компании.

Это hands-on роль с сильным уклоном в reliability engineering и инфраструктурную автоматизацию: вам предстоит развивать мониторинг, поддерживать и улучшать инфраструктуру, участвовать в расследовании инцидентов и помогать команде выстраивать инженерные практики вокруг стабильности и observability.

Чем предстоит заниматься:

Развивать и поддерживать системы мониторинга, алертинга и сбора метрик
Выстраивать observability-практики совместно с командами разработки
Настраивать и сопровождать Grafana, Prometheus, VictoriaMetrics
Поддерживать и развивать инфраструктуру как код (IaC) с использованием Terraform и Ansible
Участвовать в ревью инфраструктурных изменений и улучшении процессов эксплуатации
Оптимизировать расходы на инфраструктуру и облачные ресурсы
Помогать команде в расследовании и устранении инцидентов
Проводить диагностику сетевых и инфраструктурных проблем
Поддерживать Linux-инфраструктуру и внутренние репозитории
Взаимодействовать с разработчиками по вопросам логгирования, метрик и reliability best practices

Что для нас важно:

Опыт работы в SRE/DevOps от 3 лет
Опыт работы системным администратором, в L2/B2B support или смежной инфраструктурной роли на раннем этапе карьеры
Хорошее понимание Linux (Ubuntu-based дистрибутивы)
Практический опыт работы с Terraform и Ansible
Опыт построения или серьёзного развития систем мониторинга
Уверенные навыки работы с Grafana и Prometheus
Понимание принципов Infrastructure as Code и организации инфраструктурных репозиториев
Понимание сетевой модели TCP/IP и навыки диагностики сетевых проблем
Опыт работы с облачными платформами (AWS, GCP, Azure)
Навыки автоматизации на Python
Понимание лучших практик эксплуатации и reliability engineering
Хорошие коммуникационные навыки и готовность брать на себя лидерскую роль в будущем

Будет плюсом:

Опыт работы с VictoriaMetrics
Опыт работы с модулями ядра Linux
Базовые знания C
Опыт оптимизации инфраструктурных расходов
Опыт участия в incident response и postmortem-процессах
Опыт построения мониторинга “с нуля”
Опыт работы в высоконагруженных или распределённых системах

Важно:
По всем ключевым направлениям мы проводим глубокое техническое интервью — для нас важны не только знания инструментов, но и понимание принципов их работы, лучших практик и наличие реального практического опыта.

Условия: