Санкт-Петербург, Липовая аллея, 9
Метро: Комендантский проспектМы ищем руководителя команды инфраструктуры, который возглавит существующую команду из 14 инженеров, отвечающую за круглосуточную эксплуатацию и развитие собственной геораспределённой инфраструктуры компании.
iFuture – продуктовая IT-компания, мы разрабатываем собственный международный продукт с многомиллионной аудиторией в сфере спортивной аналитики и развлечений уже на протяжении 29 лет.
На старте потребуется активно погружаться в технические задачи, процессы эксплуатации и инциденты, а в дальнейшем сосредоточиться на развитии команды, внедрении SRE-практик и повышении эффективности работы подразделения.
Эта роль подойдёт вам, если вы получаете удовольствие не только от технологий, но и от развития людей. Если вы готовы принимать решения в кризисных ситуациях и способны быть техническим авторитетом для команды инфраструктурных инженеров.
Чем предстоит заниматься
* Руководить командой инфраструктурных инженеров, работающих в режиме 24/7.
* Развивать команду: проводить регулярные 1:1, участвовать в performance review, формировать планы развития сотрудников.
* Участвовать в найме, адаптации и удержании сотрудников.
* Выступать владельцем критических инцидентов и координировать их устранение при необходимости привлечения нескольких команд.
* Обеспечивать развитие процессов управления инцидентами, развитие практики postmortem и процесса управления проблемами (problem management).
* Формировать и развивать культуру ответственности и инженерного лидерства внутри команды.
* Разрабатывать систему метрик команды и использовать данные для принятия управленческих решений.
* Внедрять и развивать практики SRE.
* Взаимодействовать со смежными командами разработки, эксплуатации и поддержки.
* Участвовать в решении технических вопросов команды и помогать в сложных инженерных задачах.
Наша инфраструктура
* Kubernetes (собственные кластеры)
* OpenStack
* VMware
* Linux
* Git
* Ansible
* Bash / Python
* HAProxy
* Nginx
* Системы мониторинга, логирования и трассировки
* Геораспределённая инфраструктура собственной разработки
Мы ожидаем
* Опыт управления инженерной командой от 8 человек.
* Опыт найма, адаптации и развития сотрудников.
* Опыт управления эксплуатацией высоконагруженных систем в режиме 24/7.
* Опыт участия в крупных инцидентах и готовность брать на себя ответственность в кризисных ситуациях.
* Опыт построения процессов и внедрения инженерных практик.
* Уверенные знания Linux, сетевых технологий и современных инфраструктурных платформ.
* Практический опыт работы с Kubernetes.
* Понимание принципов SRE, observability и incident management.
* Развитые коммуникативные навыки и умение выстраивать взаимодействие между командами.
Будет преимуществом
* Опыт внедрения SRE-практик в существующей организации.
* Опыт эксплуатации OpenStack.
* Опыт работы с собственными дата-центрами и bare metal инфраструктурой.
* Опыт работы с высоконагруженными Java-сервисами.
Что будет важно в первые 6 месяцев?
* Стабилизировать команду и ускорить адаптацию новых сотрудников.
* Сохранить высокий уровень реагирования на инциденты.
* Начать внедрение практик SRE и повышения надёжности сервисов.
* Реализовать метрики по кризисным инцидентам, и сформировать план действий на основе метрик.
* Повысить прозрачность команды через операционные метрики команды.
* Усилить процессы incident management, postmortem и problem management.
Мы предлагаем:
Санкт-Петербург
до 250000 RUR