Москва, 1-й Волконский переулок, 15
Метро: Цветной бульварH3llo.Cloud — это публичное облако. Предоставляем IaaS/PaaS сервисы с 99.97% - 99.99% SLA в масштабе hyperscale. В нашем production-стеке:
Задачи:
Обеспечивать доступность сервисов на уровне 99.97 — 99.99%
Оптимизировать кластеры для 1000+ нод
Реализовывать zero-downtime апгрейды и blue-green деплой
Разрабатывать механизмы соблюдения SLI/SLO/Error Budgets
Реализовывать мультитенантность и сетевые политики
Оптимизировать etcd performance
Воплощать в жизнь и проводить регулярные испытания disaster recovery
Участвовать в on-call трабл-шутингах с MTTR < 15 минут
Требования:
5+ лет production-опыта с Kubernetes в high-load окружении (>10K RPS)
Экспертное знание Kubernetes internals: kube-apiserver, etcd, scheduler, kubelet, CRI/CNI/CSI
Опыт разработки production-grade операторов на Go (kubebuilder/operator-sdk)
Observability: Prometheus, Loki, Grafana, Tempo, Mimir, OpenSearch, VictoriaMetrics
GitOps: ArgoCD с Kustomize/Helm, sealed-secrets
IaC: Terraform, Ansible
Сети: CNI, IPv6, BGP, EVPN-VXLAN, Kube-OVN, Cilium
Хранение: CSI, Rook/Ceph, Linstor и DRBD
Performance testing: K6
Условия:
Офис в Москве на м. Цветной Бульвар
Работа только из офиса, без гибрида, но тебе понравится
Зарплата выше рынка
ДМС со стоматологией
Оплата профильных сертификаций и обучения
Топовое железо
Доступ к кластерам для экспериментов
Этапы отбора:
Скрининг интервью - 15 минут
Тестовое задание (1 час)
Техническое интервью с CTO (1.5 часа)
Оффер в течение 2 дней
Обязательно приложите:
Ссылки на ваш open source
Описание самого сложного production-инцидента
Ваши публикации или выступления по теме SRE/Kubernetes (если есть)
Мы ищем того, кто живёт и дышит cloud-native. Если вы можете объяснить ребёнку как работает reconciliation loop — мы ждём именно вас.