Мы ищем Senior DevOps инженера в инфраструктурную команду для развития и поддержки высоконагруженных сервисов и внутренних платформ компании.
Это hands-on роль с сильным уклоном в reliability engineering и инфраструктурную автоматизацию: вам предстоит развивать мониторинг, поддерживать и улучшать инфраструктуру, участвовать в расследовании инцидентов и помогать команде выстраивать инженерные практики вокруг стабильности и observability.
Чем предстоит заниматься:
- Развивать и поддерживать системы мониторинга, алертинга и сбора метрик
- Выстраивать observability-практики совместно с командами разработки
- Настраивать и сопровождать Grafana, Prometheus, VictoriaMetrics
- Поддерживать и развивать инфраструктуру как код (IaC) с использованием Terraform и Ansible
- Участвовать в ревью инфраструктурных изменений и улучшении процессов эксплуатации
- Оптимизировать расходы на инфраструктуру и облачные ресурсы
- Помогать команде в расследовании и устранении инцидентов
- Проводить диагностику сетевых и инфраструктурных проблем
- Поддерживать Linux-инфраструктуру и внутренние репозитории
- Взаимодействовать с разработчиками по вопросам логгирования, метрик и reliability best practices
Что для нас важно:
- Опыт работы в SRE/DevOps от 3 лет
- Опыт работы системным администратором, в L2/B2B support или смежной инфраструктурной роли на раннем этапе карьеры
- Хорошее понимание Linux (Ubuntu-based дистрибутивы)
- Практический опыт работы с Terraform и Ansible
- Опыт построения или серьёзного развития систем мониторинга
- Уверенные навыки работы с Grafana и Prometheus
- Понимание принципов Infrastructure as Code и организации инфраструктурных репозиториев
- Понимание сетевой модели TCP/IP и навыки диагностики сетевых проблем
- Опыт работы с облачными платформами (AWS, GCP, Azure)
- Навыки автоматизации на Python
- Понимание лучших практик эксплуатации и reliability engineering
- Хорошие коммуникационные навыки и готовность брать на себя лидерскую роль в будущем
Будет плюсом:
- Опыт работы с VictoriaMetrics
- Опыт работы с модулями ядра Linux
- Базовые знания C
- Опыт оптимизации инфраструктурных расходов
- Опыт участия в incident response и postmortem-процессах
- Опыт построения мониторинга “с нуля”
- Опыт работы в высоконагруженных или распределённых системах
Важно:
По всем ключевым направлениям мы проводим глубокое техническое интервью — для нас важны не только знания инструментов, но и понимание принципов их работы, лучших практик и наличие реального практического опыта.
Условия:
- Полная занятость
- Удалённый формат работы
- График 5/2
- Конкурентная заработная плата
- Возможность влиять на инфраструктурные решения и процессы
- Перспектива роста в лид-инженера / тимлида DevOps направления
- Участие в развитии быстрорастущего проекта