Ищем в команду SRE инженера с опытом создания и поддержания отказоустойчивых продуктовых и инфраструктурных сервисов
Наш стек:
Kubernetes
ArgoCD,GitLab
Nginx
VictoriaMetrics, Grafana, Loki, Jaeger
Nexus, Harbor,
PostgreSQL(Patroni), MySQL, Redis
Vault
RabbitMQ, Kafka
Подробнее о задачах:
Совместно с разработкой, проектировать и сопровождать отказоустойчивые сервисы компании
Решать сложные инциденты
Поиск и оптимизация узких мест, предотвращение инцидентов
Создание и сопровождение инфраструктурных решений
Автоматизация поиска/определения/решения инцидентов/точек отказа
Пожелания к опыту:
Обязателен опыт разработки (Python,Go)
Linux – уровень администратора
K8S – уровень администратора
Опыт с Observability инструментами
Опыт и понимание метрик SLI/SLO/SLA
Опыт создания и сопровождения отказоустойчивых систем
Опыт решения инцидентов в сложных распределенных системах
Мы предлагаем:
Online Reservation System
Москва
до 280000 RUR
Медийные Технологии
Москва
до 180000 RUR