Вакансия SRE (Инженер по доступности микросервисной платформы) в городе Москва

Описание вакансии

Комус – ведущий производитель и комплексный поставщик товаров и услуг для бизнеса.

IT-ландшафт включает в себя собственные ЦОДы, мощности в облаках и 100 бизнес-приложений, 40 из которых – крупные.

Сегодня ИТ-подразделение Комус – это аккредитованная ИТ-компания, численностью свыше 900 сотрудников.

Мы реализуем амбициозную программу цифровой трансформации, и в нашей команде открыта вакансия инженера по доступности и эксплуатации микросервисной платформы

ПРЕДЛАГАЕМ

Конкурентный доход (обсуждаем индивидуально)
Официальное оформление по ТК РФ в аккредитованную ИТ-компанию
Гибридный или удаленный формат работы (гибкость и индивидуальный подход), график 5/2 с 9.00 до 18.00
Удобную локацию – новый современный офис БЦ «Интеграл» в пешей доступности от ст. м. Авиамоторная
Развитую офисную инфраструктуру: кофе-поинты с бесплатными напитками и снеками, корпоративный бесплатный фитнес-центр и игровые пространства
ДМС
Корпоративную программу лояльности и скидок (товары и услуги, развлечения, рестораны, спорт, отдых и многое другое)
Абонементы в фитнес-клубы по специальным условиям
Дополнительное премирование в рамках реферальной программы «Все в Комус»
Корпоративное обучение и поддержка опытного наставника
Возможности для развития и карьерного роста
Драйвовые мероприятия и подарки к праздникам для сотрудников и их семей

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ

Разрабатывать, поддерживать и оптимизировать микросервисную инфраструктуру на базе Kubernetes
Проектировать, развёртывать и поддерживать инфраструктуру Prometheus: федерация, sharding, high availability, оптимизация производительности
Управлять инфраструктурой через код с использованием Terraform и ArgoCD с использованием GitOps практик
Поддерживать работу стека: Kafka, Elasticsearch, Vault, Consul, GitLab, Nexus
Поддерживать, разворачивать и настраивать распределенное хранилище Ceph
Автоматизировать CI/CD-процессы в GitLab, чинить пайплайны и артефакты
Внедрять и настраивать GitOps-практики с использованием ArgoCD для деплоя приложений
Автоматизировать рутинные процессы
Проактивно видеть проблемы в будущем и предлагать их решение
Обеспечивать безопасность, отказоустойчивость и мониторинг платформы
Влиять на архитектуру кластеров для повышения её доступности, стабильности и быстродействия
Участвовать в расследовании инцидентов, проводить root cause analysis
Разрабатывать и поддерживать документацию, стандарты и гайдлайны

ДЛЯ НАС ВАЖНЫ

Опыт работы инженером (DevOps/SRE/Platform Engineer) от 2-х лет
Глубокие практические знания Kubernetes (развертывание, управление, Helm, операторы, troubleshooting)
Глубокие знания Prometheus: архитектура, модель данных, PromQL (включая сложные запросы с агрегацией и функциями), recording rules, alerting rules, service discovery, relabeling, federation
Опыт эксплуатации Prometheus в production: настройка retention, оптимизация потребления ресурсов, troubleshooting
Уверенная работа с Grafana: разработка сложных дашбордов, variables, provisioning, настройка alerting
Понимание принципов работы систем логирования и трассировки
Уверенное владение Terraform и понимание принципов IaC (Infrastructure as Code).
Опыт настройки и администрирования как минимум трех из перечисленных технологий: Kafka, Elasticsearch, Vault, Consul, Ceph
Понимание принципов CI/CD и опыт работы с GitLab CI
Знание основ сетей (TCP/IP, DNS, Load Balancing, firewall)
Знакомы с ArgoCD для управления деплоями
Понимаете принципы CI/CD и DevOps-культуры
Готовность работать в команде, участвовать в код-ревью и писать понятный, поддерживаемый код для инфраструктуры

БУДЕТ ПЛЮСОМ

Опыт работы с Mimir, Thanos или Cortex
Опыт работы с Loki и LogQL
Опыт работы с Tempo или Jaeger
Знание OpenTelemetry (metrics, logs, traces)
Опыт работы с инструментами профилирования (Pyroscope, async-profiler, JFR/JMC)
Опыт работы с ArgoCD
Знание языков программирования Python, Go на уровне скриптов
Опыт работы с облачными провайдерами (DataLine,VK,Yandex,SberCloud)
Опыт построения высокодоступных систем
Понимание подходов SRE: SLI/SLO/SLA, error budgets
Опыт построения высокодоступных систем мониторинга
Понимание методологии GitOps

Навыки

Kubernetes
Terraform
ArgoCD
Kafka
Elasticsearch
Vault
Consul
Gitlab
Nexus
Ceph
Prometheus

Посмотреть контакты работодателя

Адрес

Зарплата
Не указана
Занятость
,
Опыт работы
Более 6 лет
Дата размещения:
15.01.2026 03:12:19

SRE (Инженер по доступности микросервисной платформы)

SRE (Инженер по доступности микросервисной платформы)

Описание вакансии

Навыки

Адрес

Краткое описание вакансии

Зарплата

Занятость

Опыт работы

Дата размещения:

Похожие вакансии

Хотите оставить вакансию?