Обязанности:
- Обеспечение надежности, масштабируемости и производительности систем и инфраструктуры.
- Ответственность за SLO, SLI и SLA
- Мониторинг, автоматизация и оптимизация процессов развертывания и эксплуатации.
- Разрешение инцидентов, анализ корневых причин и внедрение мер по предотвращению их повторений.
- Разработка и поддержка инструментов для автоматизации (инфраструктура как код, CI/CD).
- Сотрудничество с разработчиками для интеграции лучших практик DevOps/SRE.
- Участие в on-call встречах для оперативного реагирования на сбои.
Технические навыки:
- Глубокие знания в системах контейнеризации и оркестрации Docker, Kubernetes (K8s)
- Знания инструментов инфраструктуры как код: Terraform, Ansible
- Знания языков программирования: Python, Bash (или аналогичные для скриптинга).
- Мониторинг и логирование: Prometheus, Grafana, Jaeger, Sentry, GrayLog или аналогичные.
- CI/CD: GitLab CI, ArgoCD.
- Облачные платформы: Яндекс, K2 Cloud, AWS.
- Брокеры сообщений: RabbitMQ, Kafka
- Базы данных: PostgreSQL, MySQL, Redis, MemCashe.
- Микросервисная инфраструктура: API Gateway (KrakenD), ServiceMash, KeyCloack
- Знакомство с Microsoft tenant
- Сети и безопасность: TCP/IP, firewalls, SSL/TLS, IAM (Identity and Access Management).
- Понимание принципов SRE: SLO/SLI/SLA, error budgets, toil reduction.
Soft skills и личные качества:
- Сильные навыки решения инцидентов и аналитического мышления.
- Умение работать в команде, включая кросс-функциональное взаимодействие (с разработчиками, QA, product-менеджерами).
- Готовность к on-call дежурствам и работе в условиях высокой нагрузки.
- Желание непрерывно учиться и адаптироваться к новым технологиям.
Предлагаем:
Официальное оформление по ТК с первого дня;
Офис в центре Москвы (м. Цветной бульвар), гибридный формат работы;
Полностью белая ЗП (рыночный уровень);
Работа в ИТ компании: разработка новых продуктов.