Комус – ведущий производитель и комплексный поставщик товаров и услуг для бизнеса.
IT-ландшафт включает в себя собственные ЦОДы, мощности в облаках и 100 бизнес-приложений, 40 из которых – крупные.
Сегодня ИТ-подразделение Комус – это аккредитованная ИТ-компания, численностью свыше 900 сотрудников.
Мы реализуем амбициозную программу цифровой трансформации, и в нашей команде открыта вакансия инженера по доступности и эксплуатации микросервисной платформы
ПРЕДЛАГАЕМ
- Конкурентный доход (обсуждаем индивидуально)
- Официальное оформление по ТК РФ в аккредитованную ИТ-компанию
- Гибридный или удаленный формат работы (гибкость и индивидуальный подход), график 5/2 с 9.00 до 18.00
- Удобную локацию – новый современный офис БЦ «Интеграл» в пешей доступности от ст. м. Авиамоторная
- Развитую офисную инфраструктуру: кофе-поинты с бесплатными напитками и снеками, корпоративный бесплатный фитнес-центр и игровые пространства
- ДМС
-
Корпоративную программу лояльности и скидок (товары и услуги, развлечения, рестораны, спорт, отдых и многое другое)
-
Абонементы в фитнес-клубы по специальным условиям
-
Дополнительное премирование в рамках реферальной программы «Все в Комус»
-
Корпоративное обучение и поддержка опытного наставника
-
Возможности для развития и карьерного роста
-
Драйвовые мероприятия и подарки к праздникам для сотрудников и их семей
ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ
- Разрабатывать, поддерживать и оптимизировать микросервисную инфраструктуру на базе Kubernetes
- Проектировать, развёртывать и поддерживать инфраструктуру Prometheus: федерация, sharding, high availability, оптимизация производительности
- Управлять инфраструктурой через код с использованием Terraform и ArgoCD с использованием GitOps практик
- Поддерживать работу стека: Kafka, Elasticsearch, Vault, Consul, GitLab, Nexus
- Поддерживать, разворачивать и настраивать распределенное хранилище Ceph
- Автоматизировать CI/CD-процессы в GitLab, чинить пайплайны и артефакты
- Внедрять и настраивать GitOps-практики с использованием ArgoCD для деплоя приложений
- Автоматизировать рутинные процессы
- Проактивно видеть проблемы в будущем и предлагать их решение
- Обеспечивать безопасность, отказоустойчивость и мониторинг платформы
- Влиять на архитектуру кластеров для повышения её доступности, стабильности и быстродействия
- Участвовать в расследовании инцидентов, проводить root cause analysis
- Разрабатывать и поддерживать документацию, стандарты и гайдлайны
ДЛЯ НАС ВАЖНЫ
- Опыт работы инженером (DevOps/SRE/Platform Engineer) от 2-х лет
- Глубокие практические знания Kubernetes (развертывание, управление, Helm, операторы, troubleshooting)
- Глубокие знания Prometheus: архитектура, модель данных, PromQL (включая сложные запросы с агрегацией и функциями), recording rules, alerting rules, service discovery, relabeling, federation
- Опыт эксплуатации Prometheus в production: настройка retention, оптимизация потребления ресурсов, troubleshooting
- Уверенная работа с Grafana: разработка сложных дашбордов, variables, provisioning, настройка alerting
- Понимание принципов работы систем логирования и трассировки
- Уверенное владение Terraform и понимание принципов IaC (Infrastructure as Code).
- Опыт настройки и администрирования как минимум трех из перечисленных технологий: Kafka, Elasticsearch, Vault, Consul, Ceph
- Понимание принципов CI/CD и опыт работы с GitLab CI
- Знание основ сетей (TCP/IP, DNS, Load Balancing, firewall)
- Знакомы с ArgoCD для управления деплоями
- Понимаете принципы CI/CD и DevOps-культуры
- Готовность работать в команде, участвовать в код-ревью и писать понятный, поддерживаемый код для инфраструктуры
БУДЕТ ПЛЮСОМ
- Опыт работы с Mimir, Thanos или Cortex
- Опыт работы с Loki и LogQL
- Опыт работы с Tempo или Jaeger
- Знание OpenTelemetry (metrics, logs, traces)
- Опыт работы с инструментами профилирования (Pyroscope, async-profiler, JFR/JMC)
- Опыт работы с ArgoCD
- Знание языков программирования Python, Go на уровне скриптов
- Опыт работы с облачными провайдерами (DataLine,VK,Yandex,SberCloud)
- Опыт построения высокодоступных систем
- Понимание подходов SRE: SLI/SLO/SLA, error budgets
- Опыт построения высокодоступных систем мониторинга
- Понимание методологии GitOps