Опыт от 5 лет в DevOps/SRE/Infrastructure Operations.
Опыт от 1 года в роли Team Lead или Tech Lead.
Глубокий опыт эксплуатации production-инфраструктуры под нагрузкой.
Уверенное понимание Linux, сетей, отказоустойчивости, балансировки нагрузки и принципов high availability.
Практический опыт с базами данных и брокерами сообщений: PostgreSQL, MongoDB, Redis/Valkey, RabbitMQ, Kafka/Redpanda.
Опыт работы с Kubernetes на уровне эксплуатации инфраструктурных компонентов.
Опыт работы с облачными провайдерами: Yandex Cloud, AWS, Selectel, Hetzner или аналогичными.
Уверенное владение Terraform, Ansible или другими инструментами Infrastructure as Code.
Опыт построения и сопровождения backup/restore-процессов для production-систем.
Понимание observability-подходов: метрики, логи, трейсы, алерты, SLI/SLO.
Уверенное владение Bash, Python или Go для автоматизации.
Умение разбирать инциденты, находить root cause и доводить технические улучшения до результата.
Способность аргументировать технические решения, договариваться с соседними командами и выстраивать понятные процессы взаимодействия.
Будет плюсом:
Опыт эксплуатации ClickHouse, Airflow, Superset, Redash, Trino.
Опыт с EMQX, HAProxy и IoT-нагрузкой.
Опыт построения платформенных сервисов для внутренних команд.
Опыт внедрения FinOps-практик и оптимизации облачных расходов.
Опыт с APM, distributed tracing и централизованной доставкой логов.
Опыт построения disaster recovery-процессов.
Понимание security best practices для инфраструктурных сервисов.
Управлением командой DevOps-инженеров: планированием, приоритизацией, развитием инженеров, распределением ответственности.
Поддержкой и развитием инфраструктурных компонентов: MongoDB, managed PostgreSQL, Redis/Valkey, RabbitMQ, Kafka/Redpanda, FreeIPA, OpenVPN.
Поддержкой облачной инфраструктуры и связанных компонентов в Yandex Cloud, Selectel, MWS: compute, NAT, NLB, S3 и смежные сервисы.
Эксплуатацией и развитием IoT-инфраструктуры в Kubernetes: EMQX, HAProxy и связанные компоненты.
Поддержкой инфраструктуры DWH, Dynamic Pricing и BI: ClickHouse, Airflow, Superset, Redash, Trino.
Развитием инструментов управления инфраструктурой: Terraform, Ansible, AWX.
Поддержкой инфраструктуры доставки логов, трейсов и APM.
Участием в инцидентах, где проблема коррелирует с зоной ответственности команды.
Проведением постмортемов и внедрением улучшений для повышения надёжности инфраструктуры.
Взаимодействием с командами разработки, SRE, Security и продуктовых направлений.
Формированием технических стандартов эксплуатации инфраструктурных сервисов.
Сильный федеральный бренд, один из лидеров на рынке России;
Полностью белая и своевременная заработная плата и официальное оформление по ТК РФ;
График работы 5/2, 8-ми часовой рабочий день, с гибким началом дня;
Широкую зону ответственности и возможность расти вместе с компанией;
Обучение и развитие (оценка компетенций сотрудников, составление ИПР для сотрудников);
Полное отсутствие бюрократии;
Интересные профессиональные задачи;
Талантливая команда, готовая поддержать ваши инициативы, где вы сможете наблюдать, как выстраиваются четкие процессы там, где был беспорядок и участвовать в их построении;
ДМС (стоматология, телемедицина, психолог, вызов врача на дом, а также вызов «скорой помощи», полис путешественника);
Возможность реализовать свои идеи в проекте с многомиллионной аудиторией;
Бонусы для поездок на электросамокатах Юрент.