Yandex Cloud — это облачная платформа, предоставляющая полный спектр облачных сервисов для клиентов. Наша задача — помочь бизнесам всех размеров применять облачные технологии для повышения эффективности их деятельности, используя инфраструктуру и уникальные технологии Яндекса.
Мы ищем опытного инженера на позицию Customer Reliability Engineer (CRE). CRE — важная роль в клиентской организации Yandex Cloud. Его основная задача — работа с наиболее важными клиентами и оказание им помощи по вопросам надёжности и отказоустойчивости критичных информационных систем, развёрнутых в Yandex Cloud. CRE должен обладать глубокими технологическими знаниями облачных сервисов и руководствоваться практиками SRE при работе.
Какие задачи вас ждут
Проблем-менеджмент клиентских информационных систем
Вам нужно будет проводить регулярные чекапы (проверки на соответствие рекомендациям отказоустойчивости) клиентских информационных систем в инфраструктуре Yandex Cloud. Также на вас будет организация проведения нагрузочных и хаос-тестов, решение клиентских инцидентов и взаимодействие с командами клиента и Yandex Cloud в War Room.
Взаимодействие с командами клиентов
Вам предстоит разбирать клиентские инциденты с командой клиента, готовить Root Cause Analysis и список Action Items для предотвращения. Также вы будете регулярно взаимодействовать с командами внутри Yandex Cloud (техническая поддержка, архитекторы, разработчики, аккаунт-менеджеры), чтобы решать клиентские проблемы и снимать технические блокеры при использовании сервисов Yandex Cloud. Помимо этого, вам нужно будет выступать на отчётных клиентских мероприятиях в треке «Статистика проблем и повышение надёжности клиентских информационных систем».
Мы ждем, что вы
Будет плюсом, если вы