Астрал-Софт — крупная аккредитованная российская IT-компания.
Мы — эксперты в разработке сервисов обмена электронными документами, систем взаимодействия с контролирующими органами и высоконагруженных информационных систем. Создаем решения, которые помогают бизнесу сохранять время и деньги.
Мы находимся в поиске SRE Lead для поддержания стабильной, безопасной и эффективной работы IT‑систем.
Чем предстоит заниматься:
Составление требований к наблюдаемости продуктов.
Автоматизация процессов надежности (SLO Dashboard, Error Budgets, Reliability Review).
Внедрение тестирования устойчивости от сбоев (Chaos Engineering).
Участие в решении инцидентов, составление Postmortem.
Активное взаимодействие с командой разработки и DevOps.
Мы ожидаем:
Опыт работы в роли SRE или DevOps-инженера от 5 лет, опыт руководства командой от 2 лет.
Знания и практический опыт внедрения SRE – практик.
Опыт разработки и контроля метрик SLA/SLI/SLO, Error Budget.
Умение проводить анализ инцидентов для предотвращения их повторения.
Опыт работы с инструментами автоматизации: Ansible, Terraform.
Опыт работы с инструментами мониторинга и логирования (Prometheus, VictoriaMetrics, Grafana, ELK).
Опыт работы с Kubernetes, системами CI/СD.
Будет плюсом:
Опыт работы с облачными платформами (Yandex Cloud).
Мы предлагаем:
Оформление по ТК РФ.
ДМС со стоматологией с первого месяца работы.
Присоединяйтесь к нам!