Обеспечивать доступность инфраструктурных компонентов публичного облака в режиме 24/7/365 в соответствии с принятыми SLA;
Настройка, мониторинг, автоматизация и дальнейшее улучшение существующей инфраструктуры;
Активное взаимодействовать с командами разработки, тестирования, эксплуатации и поддержки.
Для нас важно:
Фундаментальные знания устройства Linux-систем;
Фундаментальные знания сетевого стека TCP/IP (TCP, UDP, NAT, HTTP, DNS и т.д.);
Опыт работы с инструментами балансировки и их «тюнинг» (например, Nginx, HAProxy и др);
Опыт работы с СУБД (например, PostgreSQL Redis, ClickHouse)
Опыт работы с брокерами сообщений (например, RabbitMQ, Kafka)
Опыт работы с контейнерными средами и платформами их оркестрации (например, Docker\Podman, Kubernetes\OpenShift);
Опыт работы с инфраструктурой в vCenter (жизненный цикл ВМ, настройка EDGE – Nat, Firewall), vCloud;
Опыт работы с системами управления конфигурациями Ansible, Terraform для описания инфраструктуры Infrastructure as Code;
Понимание принципов CI/CD, опыт работы в написании и поддержки pipelines (например, Gitlab-CI);
Опыт работы с платформой мониторинга и логирования на базе Victoria Metrics (или Prometheus), Alert Manager, Grafana, Opensearch (ELK), в том числе настройка сборщиков метрик, получения логов от приложения и настройка на их основе дашбордов, создание модификация дашбордов в Grafana\Kibana;
Опыт взаимодействия с командами разработки и L1/L2 линиями тех. поддержки. Умение работать в команде.