Customer Reliability Engineer

Яндекс

Customer Reliability Engineer

Описание вакансии

Yandex Cloud — это облачная платформа, предоставляющая полный спектр облачных сервисов для клиентов. Наша задача — помочь бизнесам всех размеров применять облачные технологии для повышения эффективности их деятельности, используя инфраструктуру и уникальные технологии Яндекса.

Мы ищем опытного инженера на позицию Customer Reliability Engineer (CRE). CRE — важная роль в клиентской организации Yandex Cloud. Его основная задача — работа с наиболее важными клиентами и оказание им помощи по вопросам надёжности и отказоустойчивости критичных информационных систем, развёрнутых в Yandex Cloud. CRE должен обладать глубокими технологическими знаниями облачных сервисов и руководствоваться практиками SRE при работе.

Какие задачи вас ждут

Проблем-менеджмент клиентских информационных систем
Вам нужно будет проводить регулярные чекапы (проверки на соответствие рекомендациям отказоустойчивости) клиентских информационных систем в инфраструктуре Yandex Cloud. Также на вас будет организация проведения нагрузочных и хаос-тестов, решение клиентских инцидентов и взаимодействие с командами клиента и Yandex Cloud в War Room.

Взаимодействие с командами клиентов
Вам предстоит разбирать клиентские инциденты с командой клиента, готовить Root Cause Analysis и список Action Items для предотвращения. Также вы будете регулярно взаимодействовать с командами внутри Yandex Cloud (техническая поддержка, архитекторы, разработчики, аккаунт-менеджеры), чтобы решать клиентские проблемы и снимать технические блокеры при использовании сервисов Yandex Cloud. Помимо этого, вам нужно будет выступать на отчётных клиентских мероприятиях в треке «Статистика проблем и повышение надёжности клиентских информационных систем».

Мы ждем, что вы

  • Работали в технической поддержке или на позиции SRE
  • Решали проблемы в k8s-кластерах в прод-среде, понимаете внутреннее устройство отказоустойчивого кластера k8s
  • На практике знакомы с облачными технологиями
  • Понимаете стек протоколов модели OSI, основы маршрутизации, умеете диагностировать сетевые проблемы
  • Знаете, как работают сервисы в OS Linux, а также основные команды диагностики; в состоянии определить причины снижения производительности сервиса
  • Хорошо разбираетесь в устройстве СУБД (PostgreSQL, MySQL, Mongo, ClickHouse, Greenplum)
  • Знакомы с методами построения архитектуры прикладных решений
  • Стрессоустойчивы и конструктивны в ситуациях критических клиентских эскалаций
  • Не боитесь коммуницировать с клиентами и умеете чётко объяснять, что вы им предлагаете

Будет плюсом, если вы

  • Участвовали в реализации ИТ-проектов с крупными компаниями в технической роли
  • Имеете хорошие коммуникативные навыки
  • Умеете приоритизировать задачи по степени влияния на бизнес
  • Понимаете современные технологические и бизнес-задачи различных индустрий
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию