Международная продуктовая компания, которая занимается разработкой и поддержкой высоконагруженных проектов для крупных компаний, основная часть которых представляет собой развлекательные онлайн-сервисы, в поисках SRE/DevOps инженера.
Чем предстоит заниматься:
- Участие в проектировании, внедрении и поддержке решений для обеспечения высокой доступности (HA) и отказоустойчивости систем.
- Сопровождение стратегии Observability и решений ее обеспечивающих(VM stack, CloudWatch, ELK etc)
- Настройка и поддержка мониторинга, дашбордов, алертинга с учетом особенностей систем
- Формирование и постоянная работа со стратегией создания инцидентов ирегламентов по работе с ними
- Обеспечение соответствующего реагирования на инциденты PagerDuty согласно регламенту и OnCall дежурствам
- Разработка и реализация мер для предотвращения повторных инцидентов.
- Взаимодействие с командами разработки для внедрения принципов надежного дизайна систем.
- Обучение команд инструментам Observability, мониторинга и принципам надежности
- Реагирование на инциденты в PagerDuty,
Ожидания от кандидата:
- Опыт работы SRE Engineer от 3 лет
- Обязательный опыт работы с инструментами observability: OpenTelemetry, Loki, Grafana, Tempo, Mimir, Victoria metrics, Elastic Stack (ELK), Vector, Sentry
- Опыт работы с Kubernetes, Docker
- Опыт описания IaC в Terraform, Ansible
- Опыт сопровождения backend команд использующих .Net как основной framework
- Опыт работы с CI/CD системами: GitLab CI/CD, ArgoCD
- Опыт в решении критических инцидентов и проведении Post-Mortem, RCA
- Умение и желание взаимодействовать с различными командами разработки и инфраструктуры, способность четко доносить свои идеи и предложения.
- Проактивность и инициативность в предложении улучшений
Что компания может вам предложить:
- Удаленный/офисный/гибрид формат работы (на ваш выбор)
- Возможность развивать свои компетенции и применять знания на практике
- Возможность поработать на крупных проектах
- Компания заинтересована в развитии своих сотрудников: готовы привлекать наставников и оплачивать курсы для повышения квалификации
- Отсутствие бюрократии, быстрое согласование необходимых вещей
- Оплачиваемые лист нетрудоспособности (больничный лист) и отпускные
- Частичная компенсация английского или сербского языков
- 4 day-off в год за счет компании
- Компания поддерживает сотрудника в важные периоды жизни
- Годовой бонус по результатам работы
- Большая высококвалифицированная команда, к которой всегда можно обратиться за помощью
- Реферальная программа за успешную рекомендацию