Старший инженер по эксплуатации (SRE)

Описание вакансии

Мы – РТК ИТ, федеральная компания с подразделениями в 7 субъектах РФ. Мы занимаемся полным циклом разработки программных продуктов, направленных на развитие и повышение эффективности бизнеса группы компаний «Ростелеком». Наши ИТ-решения, отвечают современным реалиям как в ИТ-архитектуре, так и в телеком-бизнесе. Используя современные технологии, подходы к разработке и архитектуре мы достигаем максимально эффективного результата.

Ищем к себе в команду инженера по эксплуатации (SRE)

О проекте:

«Игры Ростелеком» — это новая онлайн-платформа для геймеров, а также уникальные возможности для разработчиков и дистрибьюторов видеоигр. Площадка объединяет игровой маркетплейс и лаунчер для партнеров из игровой индустрии. Развивая игровое направление, «Ростелеком» готов поддерживать отечественных разработчиков. Именно с этой целью запущен портал-лаунчер «Игры Ростелеком», который открывает большие возможности для создателей видеоигр. Компания максимально упростила технический процесс размещения игрового контента, а специальные условия для отечественных инди-разработчиков дают начинающим командам шанс представить свои проекты широкой аудитории.

Чем нужно будет заниматься:

Обеспечение высокой доступности и надежности наших сервисов: Мониторинг систем, выявление и устранение проблем, участие в дежурствах;
Автоматизация процессов: Разработка и внедрение инструментов и скриптов для автоматизации развертывания, масштабирования, мониторинга и восстановления;
Улучшение инфраструктуры: Оптимизация производительности, масштабируемости и безопасности наших систем;
Реагирование на инциденты: Участие в on-call дежурствах, анализ причин сбоев и разработка мер по их предотвращению;
Сотрудничество с командами разработки и эксплуатации: Обмен знаниями, участие в code review, консультирование по вопросам надежности и эксплуатации;
Постоянное совершенствование: Анализ метрик, выявление возможностей для улучшения, внедрение новых технологий и подходов;
Проведение анализа первопричин (Root Cause Analysis) в случае инцидентов;
Разработка и поддержание документации по инфраструктуре и процессам.

Что мы ожидаем от вас:

Уверенные знания Unix-подобных операционных систем (RPM, DEB): Опыт администрирования и troubleshooting от 2 лет;
Опыт эксплуатации высоконагруженных систем (Highload): Практический опыт поддержки и оптимизации систем, подверженных высоким нагрузкам;
Понимание принципов DevOps и опыт их применения на практике: Опыт работы в DevOps-культуре, понимание принципов автоматизации, инфраструктуры как кода и непрерывной поставки;
Глубокое понимание современных веб-приложений и опыт их эксплуатации (от 3 лет): Знание архитектуры веб-приложений, протоколов, подходов к мониторингу и логированию;
Знание базовых протоколов (HTTP, TCP/IP) и принципов работы сетей: Понимание основ сетевого взаимодействия, умение диагностировать сетевые проблемы;
Понимание принципов работы распределенных систем: Знание архитектуры распределенных систем, принципов масштабирования и отказоустойчивости, понимание назначения компонентов;
Опыт работы с оркестраторами контейнеров (Kubernetes, OpenShift): Развертывание, масштабирование и управление приложениями в Kubernetes или OpenShift;
Умение грамотно подходить к задачам и выстраивать процессы: Аналитическое мышление, умение находить оптимальные решения, выстраивать эффективные процессы;
Навыки работы с Git и системами управления инфраструктурой: Опыт работы с Git, знание принципов Infrastructure as Code (IaC);
Опыт использования Ansible/Puppet: Практический опыт автоматизации управления конфигурацией с использованием Ansible или Puppet;
Умение писать скрипты на одном из языков программирования (Python, Go, Bash и т.д.) для автоматизации задач;
Опыт работы с системами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.).

Что мы предлагаем:

Удаленная работа, либо гибридный график работы в комфортном офисе в городах, где есть офис Ростелеком ИТ - если нужен офис :)
Полностью "белая" заработная плата: оклад + квартальная премия;
«Кафетерий льгот» с возможностью выбора категорий (ДМС или компенсация медицинских услуг по чекам, компенсация затрат на спорт, на изучение иностранного языка, проезд, дополнительные выплаты ко дню рождения, онлайн-обучение и др.), компенсация мобильной связи;
Дружеская атмосфера и профессиональная команда, готовая делиться опытом;
Возможность раскрытия своего собственного потенциала (ты можешь проходить оплачиваемые компанией тренинги, обучения и посещать конференции).

Не упусти шанс стать частью большого и развивающегося проекта!:)