Мы ищем опытного и мотивированного тимлида, который возглавит команду администраторов (Infrastructure Engineers), отвечающую за надежность, производительность и развитие критически важных сервисов HR-платформы Сбера. Вы будете не только техническим лидером, но и наставником для команды, ответственным за качество процессов и стратегическое развитие инфраструктуры.
Обязанности
- формирование, развитие и мотивация команды администраторов (Infrastructure Engineers).
- постановка целей (OKR), планирование и распределение задач, проведение регулярных 1:1 и performance review.
- постоянное улучшение процессов сопровождения, мониторинга и автоматизации.
- траблшутинг сложных проблем в распределенных высоконагруженных системах.
- анализ инцидентов и разработка рекомендаций по повышению отказоустойчивости, масштабируемости и производительности HR-платформы.
- развитие проактивного и реактивного мониторинга, создание эффективных алертов на основе SLO.
- участие в проектировании архитектуры новых сервисов с учетом требований надежности и эксплуатации.
- участие в разработке и внедрение стратегии надежности и производительности ключевых сервисов.
- тесная работа с командами разработки, тестирования и продукта на протяжении всего жизненного цикла сервиса.
- взаимодействие с командами поддержки и сопровождения HR-платформы (SRE, DBA, Devops)
- взаимодействие с командами сопровождения инфраструктуры банка
Требования
- опыт управления командой Dev/DevOps/SRE/Infrastructure от 3 лет (постановка задач, мотивация, развитие, найм).
- глубокий практический опыт (от 5 лет) в роли Infrastructure/DevOps-инженера или SRE.
- глубокое понимание и практическое применение философии и практик SRE (Site Reliability Engineering).
- экспертные навыки траблшутинга в сложных распределенных системах.
- опыт построения, масштабирования и поддержки высоконагруженных отказоустойчивых систем.
- уверенное владение основными инструментами автоматизации: Ansible, Terraform.
- глубокие знания в области контейнеризации и оркестрации: Docker, Kubernetes (Openshift).
- уверенное знание одного из языков для автоматизации: Python, Go, Ruby или Bash.
- опыт работы с системами мониторинга и визуализации: Prometheus, Grafana, Zabbix, Dynatrace.
Технический стек:
- Linux: RHEL
- Docker, Kubernetes, Openshift (CRI, CNI, CSI)
- Nginx, envoy, openresty
- Kafka
- PostgreSQL, Redis, Clickhouse
- Vault, Consul SD
- ELK, fluentd, fluentbit
- Prometheus, Grafana, Zabbix, Dynatrace
- Jenkins, Gitlab (Drone, Gitea, Bitbucket)
- Python, ruby, bash, groovy, Go
- Ansible, terraform
Условия
- хороший офис (AgileHome) рядом со станцией метро Кутузовская со всеми удобствами (столовые + множество кафе + кухни с холодильниками, кофемашинами; бесплатный спортзал; бесплатная подземная парковка; места для отдыха - настольный теннис, несколько PlayStation, кикер, бильярд)
- достойная заработная плата (оклад + премии)
- возможность работать с современным стеком технологий
- социальный̆ пакет (ДМС)
- огромный каталог образовательных программ, возможность обучения и сертификации за счет компании
- программа льготного кредитования в СБЕРе
- дисконт-программы от множества компаний партнеров