Мы ищем инженера, которому интересно развивать надежную платформу и инфраструктуру. Вы станете ключевым игроком, отвечающим за "подкапотное" пространство, где работают наши сервисы.
Ваш фокус — эксплуатация, надежность и развитие платформы:
Управление Kubernetes (on-prem и в облаке): Обеспечивать стабильную работу кластеров, заниматься их апгрейдом, масштабированием и восстановлением после сбоев.
CI/CD и автоматизация: Поддерживать и улучшать пайплайны в Jenkins/GitLab CI.
Инфраструктура как код (IaC): Учавтсвовать в проектировании и внедрении изменений инфраструктуры через Terraform, Ansible, Helm. Мы ценим безопасный подход: поэтапные развертывания, возможность быстрого отката и контроль рисков.
Настраивать системы мониторинга и логирования (Prometheus, Grafana, Loki/ELK), чтобы видеть полную картину происходящего. Ваша задача — создавать полезные дашборды и алерты без лишнего шума, а также улучшать плейбуки для быстрой реакции линий поддержки.
Работа с инцидентами: Диагностировать и устранять проблемы в продакшне, проводить анализ пост-мортем (RCA), предлагать изменения для повышения стабильности.
Интеграции: Работать с гибридной/облачной инфраструктурой (у нас Cloud), управляя ресурсами через IaC.
Мы ищем сотрудника, у которого есть:
- Уверенные практические навыки работы с Linux (администрирование, bash, systemd, сетевые утилиты)
- Опыт поддержки продакшн-среды: умение быстро локализовать проблему, принять решение об откате и провести диагностику
- Опыт настройки CI/CD-пайплайнов в GitLab CI или Jenkins
- Владение Git и понимание моделей ветвления (Git Flow / Trunk-based)
Будет плюсом:
- Понимание процессов ITSM/ITIL (инциденты, изменения, проблемы) и опыт взаимодействия с техподдержкой или смежными командами
- Опыт администрирования Kubernetes: управление кластерами (kubeadm, Kubespray), понимание устройства компонентов (etcd, apiserver, kubelet, CNI), работа с ингресс-контроллерами (Nginx/HAProxy) и сетевыми политиками (Calico/Cilium)
- Навыки работы с Terraform, Ansible и Helm
- Понимание основ сетевых технологий: TCP/IP, DNS, HTTP/HTTPS, балансировка нагрузки, VPN
- Опыт настройки стека мониторинга и логирования (Prometheus, Grafana, Loki/ELK)
- Работа с системами хранения артефактов и секретов (GitLab Registry/Nexus, Vault/Sealed Secrets)
- Опыт работы с облачными провайдерами (Cloud.ru, AWS, GCP, Azure)
- Умение писать скрипты и инструменты на Python/Go для автоматизации рутины
- Нацеленность на лидерство и выстраивание правильных процессов без лишней бюрократии
Что мы предлагаем?
- Конкурентную зарплату с годовой премией (обсудим ваши ожидания на собеседовании)
- Официальное оформление в российскую ИТ-компанию с аккредитацией
- Привлекательные бонусы: ДМС, бесплатная подписка «СберПрайм+», скидки на изучение английского языка, бесплатный фитнес в офисе или скидки на покупку абонемента себе и близким, скидки от партнёров Сбера, корпоративная пенсионная программа
- Льготная ипотека в Сбере
- Удобный формат работы: удалённо или в гибридном фомрате, «короткая» пятница