Москва, Саввинская набережная, 15
Метро: КиевскаяGridnine имеет многолетний опыт разработки веб-приложений, систем электронной коммерции, сайтов со сложной структурой и комплексных ИТ-решений. Мы не просто выполняем проекты, а развиваем и поддерживаем созданные решения.
В нашей команде более 100 талантливых IT-специалистов. На данный момент у нас выросла нагрузка по текущим проектам, поэтому мы ищем SRE-специалиста.
Обязанности:
• Обеспечение надёжности и наблюдаемости компонентов продукта
• Создание отказоустойчивой архитектуры компонентов продукта
• Автоматизация развёртывания и обновление компонентов системы мониторинга
• Разработка, внедрение и актуализация метрики и дашбордов
• Определение и мониторинг SLO сервисов, анализ error budget
• Сотрудничество с командой разработчиков, участие в ревью продуктовых требований
• On-call инцидентная поддержка
• Проведение post-mortem инцидентов с фиксацией корневых причин
Что мы ждём от кандидата:
• Опыт администрирования Linux
• Понимание концепций SLO/SLI и подхода error budget
• Навыки работы с системами мониторинга (Zabbix) и визуализации данных (Grafana).
• Понимание принципов построения отказоустойчивых систем
• Опыт работы с системами сбора и хранения логов/трейсов
• Владение одним или несколькими скриптовыми языками (Python/Bash)
• Понимание работы сетевых протоколов (TCP/IP, DNS, HTTP и тд.)
Условия: