SRE инженер / Эксперт по обеспечению надежности

МТС Финтех

SRE инженер / Эксперт по обеспечению надежности

Описание вакансии

МТС Финтех – одно из ключевых направлений экосистемы МТС.
Мы используем современные цифровые решения и развиваем технологичные банковские сервисы, доступные каждому.

Наши команды совершенствуют финтех-продукты для В2В и В2С. Создают сайты на TypeScript + React + Next.js с SSR. И реализуют проекты в Kubernetes-среде, чтобы обеспечивать надёжность для миллионов клиентов МТС Финтех.

Наш стек:

  • Linux, PostgreSQL, RDBMS Oracle, ELK, Grafana, Zabbix, BCP/DRP, RTO, RPO, SLA/SLO/SLI, Bash, OSI.

Что для нас важно:

  • опыт внедрения практик и инструментов SRE
  • практический опыт локализации проблем и устранения инцидентов в больших и сложных системах
  • опыт разработки SLA/SLI/SLO и знаете принципы их формирования
  • умение работать с высоконагруженными сервисами
  • знание принципов и методов обеспечения качества и надёжности ИТ сервисов
  • навыки работы в Grafana – создание дашбордов, настройка Alerting
  • опыт работы с ELK (запросы, визуализация, дашборды)
  • навыки работы в ОС Linux, в том числе опыт написания bash-скриптов
  • понимание жизненный цикл ИТ-продуктов
  • опыт участия в ИТ-проектах или работы в продуктовых командах (взаимодействие с аналитиками, разработчиками, QA)
  • высшее техническое образование

Ты будешь:

  • внедрять практики SRE на уровне продуктов и систем Банка
  • формировать и контролировать реализации нефункциональных требований к доработкам
  • прорабатывать и описывать методики диагностики, подготовку эксплуатационных инструкций, обучений L1 и L2
  • улучшать метрики надежности, наблюдаемости в продуктах/системах совместно с продуктовыми командами или администраторами систем
  • выстраивать процессы управления уровнем сервиса на основе SLA/SLO/SLI
  • обеспечивать формирование планов и мероприятий по обеспечению непрерывности (DRP/DRT, катастрофоустойчивость, подтверждению заявленных RTO/RPO)
  • проактивно выявлять проблемы и дефекты функционала по продуктовым метрикам, логам, БД
  • устранять аварии и нештатные ситуации, выявлять причины, прорабатывать меры, подготавливать Postmortem-отчёты
  • проводить анализ ИТ-решений, взаимодействовать с командами и подразделениями в рамках анализа ИТ-решений и интеграций

Навыки
  • Linux
  • SRE
  • SLA
  • SLO
  • ELK
  • Grafana
  • OSI
Посмотреть контакты работодателя

Похожие вакансии

АМИКОН
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
РОССКО

Инженер SOC

РОССКО

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Х5 Group
Удаленная работа
  • Москва

  • Не указана

iSpring
Удаленная работа
  • Москва

  • Не указана

БАЗИС
Удаленная работа
  • Москва

  • Не указана

АЛРОСА
Удаленная работа
  • Москва

  • Не указана

edna
Удаленная работа
  • Москва

  • Не указана

VK
Удаленная работа
  • Москва

  • Не указана

ИК СИБИНТЕК
Удаленная работа
  • Москва

  • Не указана

Nexign (АО Нэксайн)

Ведущий инженер DBA

Nexign (АО Нэксайн)

Удаленная работа
  • Москва

  • Не указана

VK
Удаленная работа
  • Москва

  • Не указана

Интеграция Дистрибуция Проекты

Senior Quality Assurance Engineer

Интеграция Дистрибуция Проекты

Удаленная работа
  • Москва

  • Не указана

Битрикс24
Удаленная работа
  • Москва

  • Не указана

Айкон Про

SRE/Site Reliability Engineer

Айкон Про

Удаленная работа
  • Москва

  • от 370000 RUR

Риверстарт
Удаленная работа
  • Москва

  • до 300000 RUR

Cloud.ru
Удаленная работа
  • Москва

  • до 300000 RUR

HeadHunter
Удаленная работа
  • Москва

  • до 300000 RUR

Digex Co
Удаленная работа
  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию