Центр изучения и сетевого мониторинга молодёжной среды – аккредитованная IT-компания, созданная по поручению Президента России в 2018 году.
Наша миссия – разработка социально значимых технологических решений для защиты детей и подростков от деструктивного контента в цифровом пространстве. Через создание комплексной мониторинговой системы мы формируем безопасную среду для нового поколения.
Мы ищем в нашу команду Руководителя управления по развитию IT-инфраструктуры.
Чем предстоит заниматься
- Обеспечение плановых показателей доступности, отказоустойчивости, безопасности и производительности продуктов и инфраструктуры компании
- Проведение предпроектного анализа инфраструктуры и участие в проектировании архитектуры ЦОД
- Контроль эксплуатации и развитие гибридной инфраструктуры (K8s, Docker, Proxmox, Ceph, кластерные СУБД)
- Планирование и контроль бюджета (CAPEX/OPEX) на инфраструктуру, лицензионное ПО и инструменты
- Формирование технических стандартов в области IaC (Terraform, Ansible), оркестрации (Kubernetes) и управления конфигурациями
- Контроль за построением и развитием CI/CD-процессов, систем мониторинга, логирования и резервного копирования
- Повышение зрелости DevOps/SRE-практик и внедрение современных подходов (GitOps)
- Внедрение культуры DevSecOps и обеспечение соответствия требованиям корпоративных стандартов
- Управление техническим долгом, проактивная оценка и минимизация рисков для бизнеса
- Полный цикл управления командой: от найма и онбординга до развития компетенций и планирования карьеры сотрудников
- Организация эффективного взаимодействия с внутренними командами (разработки, SecOps, MLOps, поддержки) и внешними заказчиками
- Консультационная и экспертная поддержка по всем вопросам, связанным с инфраструктурой
- Личное участие в разрешении критических инцидентов и организация процессов ретроспективного анализа
Что мы ожидаем от кандидата
- Опыт управления командой DevOps/SRE/Infrastructure от 1 года (20+ человек)
- Общий технический опыт в DevOps/SRE/системном администрировании от 5 лет
- Глубокие практические знания и опыт работы со стеком:
▪️Оркестрация и контейнеризация: Kubernetes, Docker
▪️CI/CD: GitLab CI, Jenkins, ArgoCD
▪️IaC и управление конфигурациями: Terraform, Ansible
▪️Мониторинг и алертинг: Prometheus/VictoriaMetrics, Grafana, Zabbix
▪️Виртуализация и хранилища: Proxmox, Ceph, распределенные хранилища (S3-совместимые)
▪️Сети и балансировка: Nginx, HAProxy
▪️СУБД и аналитические системы: PostgreSQL, MongoDB, Redis, а также ClickHouse или аналоги для Big Data
▪️Очереди сообщений и стриминг: Kafka, RabbitMQ - Уверенные знания серверного железа, сетей, принципов информационной безопасности
- Навыки автоматизации (Python, Bash, Go)
- Понимание полного цикла жизни ML-моделей и требований к их промышленной эксплуатации
Будет значительным преимуществом
- Опыт работы с инструментами MLOps-стэка и моделями (Kubeflow, MLflow, Airflow, Triton Inference Server, vLLM, Llama)
- Практический опыт построения и сопровождения инфраструктуры для ML/AI-проектов и аналитики больших данных (MLOps)
Что мы предлагаем
- Ключевую руководящую роль в создании и развитии надежной инфраструктуры для инновационных продуктов в компании
- Официальное оформление по ТК РФ в аккредитованной IT-компании
- Конкурентную заработную плату (обсуждается по итогам собеседования)
- График работы: 5/2, с 09:00 до 18:00 или с 10:00 до 19:00 (гибридный формат после испытательного срока)
- Место работы - офис в центре Москвы