Команда Web-разработки и аналитики Social Media ищет DevOps с опытом работы в облачной инфраструктуре (с и без использования Kubernetes), а также с хорошими знаниями в области сетевой безопасности и инфраструктуры веб-сервисов и приложений. Мы ждем от кандидата прагматичный подход к автоматизации, понимание принципов масштабируемости и надежности веб-сервисов, уверенное знание в области обеспечения информационной безопасности. Важным является умение работать в команде и способность участвовать в проектировании, внедрении и обслуживании инфраструктуры для поддержания высокой степени доступности сервисов.
Чем вы будете заниматься:
- Проектирование, развертывание и управление масштабируемой и безопасной облачной инфраструктурой
- Администрирование виртуальных машин (ВМ) внутренней виртуализации и внешней облачной инфраструктуры (Yandex Cloud)
- Развертывание и поддержка кластера Kubernetes (Managed)
- Обеспечение отказоустойчивости и масштабируемости сайтов и сервисов
- Оптимизация и управление CI/CD-пайплайнов
- Мониторинг и оптимизация производительности системы
- Настройка алертинга, устранение неполадок и обеспечение высокой доступности сервисов
- Обеспечение безопасности инфраструктуры, сайтов и виртуальных машин
- Разработка скриптов и утилит для автоматизации процессов поддержки ВМ и сайтов/сервисов
- Написание документации к используемым и разработанным решениям
- Взаимодействие с командами разработки и внутренними службами компании для обеспечения бесперебойной работы и развития сайтов и сервисов.
Что вам для этого нужно:
- Глубокие знания Linux и сетевого стека ОС.
- Опыт работы с Docker, Kubernetes (в том числе Managed-версии).
- Навыки настройки CI/CD с использованием GitLab CI для разных окружений: Shell, Docker, Kubernetes.
- Уверенные знания и практический опыт работы с сетями: TCP/IP, DNS, маршрутизация, NAT, балансировка нагрузки, VPN, Proxy, VLAN.
- Отличные навыки траблшутинга, способность работать в динамичной среде.
- Практический опыт работы с облачными платформами (Yandex.Cloud, AWS, GCP, Azure).
- Инфраструктура как код (IaC): Terraform, Ansible, Helm.
Будет плюсом:
- Опыт администрирования БД (MySQL, ClickHouse, PostgreSQL), включая работу с управляемыми HA-кластерами.
- Опыт работы с системами мониторинга и логирования: Prometheus, Grafana, Loki, Alertmanager, ELK/Opensearch, OpenTelemetry.
- Опыт внедрения и обеспечения безопасности инфраструктуры, включая управление секретами (HashiCorp Vault, Yandex Lockbox).
- Умение работы с таск-трекерами (Jira) и ведения документации в базах знаний (Confluenсe).
- Опыт работы с Airflow, Superset.
- Понимание полного цикла разработки и специфики web-проектов.
- Умение эффективно коммуницировать и работать в команде.