Разработка и поддержка стратегии отказоустойчивости: создание планов и политик для обеспечения непрерывной работы систем и сервисов;
Создание планов восстановления после сбоя (DRP);
Планирование резервирования: определение необходимых резервных копий, резервных систем и мер безопасности для минимизации времени простоя в случае отказов;
Оптимизация бизнес-процессов с точки зрения стратегии отказоустойчивости;
Тестирование и обновление планов восстановления после сбоя: проведение регулярных проверок работы планов восстановления и внесение корректировок для повышения их эффективности;
Сотрудничество с другими подразделениями: обеспечение согласованности мер по обеспечению DR.
Требования:
Уверенное администрирование Windows и Linux систем;
Понимание современных технологий DR;
Опыт работы с системами резервного копирования и восстановления;
Навыки взаимодействия с бизнес-заказчиками и ведения проектов;
Опыт от 2 лет в аналогичной роли.
Будет плюсом:
Опыт с Ansible, Python для автоматизации задач;
Опыт администрирования СУБД и kubernetes;
Опыт построения геораспределенных информационных систем.
Мы предлагаем:
Полная занятость, график работы 5/2, гибкое начало рабочего дня;
Возможность профессионального роста и развития, интересные задачи в крупной компании;