Мы – РТК ИТ, федеральная компания с подразделениями в 7 субъектах РФ. Мы занимаемся полным циклом разработки программных продуктов, направленных на развитие и повышение эффективности бизнеса группы компаний «Ростелеком». Наши ИТ-решения, отвечают современным реалиям как в ИТ-архитектуре, так и в телеком-бизнесе. Используя современные технологии, подходы к разработке и архитектуре мы достигаем максимально эффективного результата.
Ищем к себе в команду инженера по эксплуатации (SRE)
О проекте:
«Игры Ростелеком» — это новая онлайн-платформа для геймеров, а также уникальные возможности для разработчиков и дистрибьюторов видеоигр. Площадка объединяет игровой маркетплейс и лаунчер для партнеров из игровой индустрии. Развивая игровое направление, «Ростелеком» готов поддерживать отечественных разработчиков. Именно с этой целью запущен портал-лаунчер «Игры Ростелеком», который открывает большие возможности для создателей видеоигр. Компания максимально упростила технический процесс размещения игрового контента, а специальные условия для отечественных инди-разработчиков дают начинающим командам шанс представить свои проекты широкой аудитории.
Чем нужно будет заниматься:
- Обеспечение высокой доступности и надежности наших сервисов: Мониторинг систем, выявление и устранение проблем, участие в дежурствах;
- Автоматизация процессов: Разработка и внедрение инструментов и скриптов для автоматизации развертывания, масштабирования, мониторинга и восстановления;
- Улучшение инфраструктуры: Оптимизация производительности, масштабируемости и безопасности наших систем;
- Реагирование на инциденты: Участие в on-call дежурствах, анализ причин сбоев и разработка мер по их предотвращению;
- Сотрудничество с командами разработки и эксплуатации: Обмен знаниями, участие в code review, консультирование по вопросам надежности и эксплуатации;
- Постоянное совершенствование: Анализ метрик, выявление возможностей для улучшения, внедрение новых технологий и подходов;
- Проведение анализа первопричин (Root Cause Analysis) в случае инцидентов;
- Разработка и поддержание документации по инфраструктуре и процессам.
Что мы ожидаем от вас:
- Уверенные знания Unix-подобных операционных систем (RPM, DEB): Опыт администрирования и troubleshooting от 2 лет;
- Опыт эксплуатации высоконагруженных систем (Highload): Практический опыт поддержки и оптимизации систем, подверженных высоким нагрузкам;
- Понимание принципов DevOps и опыт их применения на практике: Опыт работы в DevOps-культуре, понимание принципов автоматизации, инфраструктуры как кода и непрерывной поставки;
- Глубокое понимание современных веб-приложений и опыт их эксплуатации (от 3 лет): Знание архитектуры веб-приложений, протоколов, подходов к мониторингу и логированию;
- Знание базовых протоколов (HTTP, TCP/IP) и принципов работы сетей: Понимание основ сетевого взаимодействия, умение диагностировать сетевые проблемы;
- Понимание принципов работы распределенных систем: Знание архитектуры распределенных систем, принципов масштабирования и отказоустойчивости, понимание назначения компонентов;
- Опыт работы с оркестраторами контейнеров (Kubernetes, OpenShift): Развертывание, масштабирование и управление приложениями в Kubernetes или OpenShift;
- Умение грамотно подходить к задачам и выстраивать процессы: Аналитическое мышление, умение находить оптимальные решения, выстраивать эффективные процессы;
- Навыки работы с Git и системами управления инфраструктурой: Опыт работы с Git, знание принципов Infrastructure as Code (IaC);
- Опыт использования Ansible/Puppet: Практический опыт автоматизации управления конфигурацией с использованием Ansible или Puppet;
- Умение писать скрипты на одном из языков программирования (Python, Go, Bash и т.д.) для автоматизации задач;
- Опыт работы с системами мониторинга и логирования (Prometheus, Grafana, ELK stack и т.д.).
Что мы предлагаем:
Не упусти шанс стать частью большого и развивающегося проекта!:)