Руководитель управления по развитию IT-инфраструктуры

Москва

Метро: Библиотека им.Ленина

Описание вакансии

Центр изучения и сетевого мониторинга молодёжной среды – аккредитованная IT-компания, созданная по поручению Президента России в 2018 году.

Наша миссия – разработка социально значимых технологических решений для защиты детей и подростков от деструктивного контента в цифровом пространстве. Через создание комплексной мониторинговой системы мы формируем безопасную среду для нового поколения.

Мы ищем в нашу команду Руководителя управления по развитию IT-инфраструктуры.

Чем предстоит заниматься

Обеспечение плановых показателей доступности, отказоустойчивости, безопасности и производительности продуктов и инфраструктуры компании
Проведение предпроектного анализа инфраструктуры и участие в проектировании архитектуры ЦОД
Контроль эксплуатации и развитие гибридной инфраструктуры (K8s, Docker, Proxmox, Ceph, кластерные СУБД)
Планирование и контроль бюджета (CAPEX/OPEX) на инфраструктуру, лицензионное ПО и инструменты
Формирование технических стандартов в области IaC (Terraform, Ansible), оркестрации (Kubernetes) и управления конфигурациями
Контроль за построением и развитием CI/CD-процессов, систем мониторинга, логирования и резервного копирования
Повышение зрелости DevOps/SRE-практик и внедрение современных подходов (GitOps)
Внедрение культуры DevSecOps и обеспечение соответствия требованиям корпоративных стандартов
Управление техническим долгом, проактивная оценка и минимизация рисков для бизнеса
Полный цикл управления командой: от найма и онбординга до развития компетенций и планирования карьеры сотрудников
Организация эффективного взаимодействия с внутренними командами (разработки, SecOps, MLOps, поддержки) и внешними заказчиками
Консультационная и экспертная поддержка по всем вопросам, связанным с инфраструктурой
Личное участие в разрешении критических инцидентов и организация процессов ретроспективного анализа

Что мы ожидаем от кандидата

Опыт управления командой DevOps/SRE/Infrastructure от 1 года (20+ человек)
Общий технический опыт в DevOps/SRE/системном администрировании от 5 лет
Глубокие практические знания и опыт работы со стеком:
▪️Оркестрация и контейнеризация: Kubernetes, Docker
▪️CI/CD: GitLab CI, Jenkins, ArgoCD
▪️IaC и управление конфигурациями: Terraform, Ansible
▪️Мониторинг и алертинг: Prometheus/VictoriaMetrics, Grafana, Zabbix
▪️Виртуализация и хранилища: Proxmox, Ceph, распределенные хранилища (S3-совместимые)
▪️Сети и балансировка: Nginx, HAProxy
▪️СУБД и аналитические системы: PostgreSQL, MongoDB, Redis, а также ClickHouse или аналоги для Big Data
▪️Очереди сообщений и стриминг: Kafka, RabbitMQ
Уверенные знания серверного железа, сетей, принципов информационной безопасности
Навыки автоматизации (Python, Bash, Go)
Понимание полного цикла жизни ML-моделей и требований к их промышленной эксплуатации

Будет значительным преимуществом

Опыт работы с инструментами MLOps-стэка и моделями (Kubeflow, MLflow, Airflow, Triton Inference Server, vLLM, Llama)
Практический опыт построения и сопровождения инфраструктуры для ML/AI-проектов и аналитики больших данных (MLOps)

Что мы предлагаем

Ключевую руководящую роль в создании и развитии надежной инфраструктуры для инновационных продуктов в компании
Официальное оформление по ТК РФ в аккредитованной IT-компании
Конкурентную заработную плату (обсуждается по итогам собеседования)
График работы: 5/2, с 09:00 до 18:00 или с 10:00 до 19:00 (гибридный формат после испытательного срока)
Место работы - офис в центре Москвы

Посмотреть контакты работодателя