Мы работаем на современном технологическом стеке и с выстроенными, чистыми процессами. AI-инструменты (Windsurf, Codex и аналоги) — часть ежедневной работы: для рутинных задач, ускорения диагностики и аккуратного рефакторинга с обязательной проверкой и валидацией результата.
Сейчас мы в поиске devOps инженера в нашу небольшую команду!
Проектировать и поддерживать инфраструктуру продуктовых сервисов (prod/stage/dev) с четким разделением окружений и предсказуемыми релизами.
Эксплуатировать Kubernetes-кластеры и окружения приложений (deployments, autoscaling, rolling/blue-green обновления).
Разрабатывать и поддерживать Infrastructure as Code (Terraform), хранить инфраструктуру в Git и работать через PR и ревью.
Создавать и улучшать CI/CD-пайплайны, ускорять сборки, стабилизировать деплой и откаты (rollbacks).
Настраивать наблюдаемость (observability): метрики, логи, алертинг и спокойные on-call рутины.
Управлять секретами и доступами (IAM, RBAC), поддерживать высокую «гигиену» безопасности.
Взаимодействовать с разработчиками: разбор инцидентов, постмортемы и улучшения надежности.
Linux: уверенные навыки эксплуатации, диагностики и отладки, базовые знания сетей (TCP/IP, DNS, TLS).
Опыт работы с облаком (любой провайдер): практическое понимание ключевых облачных концепций (сети, IAM, managed services, storage). Мы работаем в GCP, но подойдет опыт AWS/Azure/других облаков.
Docker: сборка образов, оптимизация, использование безопасных базовых образов.
Kubernetes: deployments/statefulsets, ingress, services, HPA, namespaces, RBAC, troubleshooting.
IaC: Terraform (modules, state, best practices), понимание жизненного цикла инфраструктуры.
CI/CD: GitLab CI или GitHub Actions (или аналогичные системы), практическая поддержка пайплайнов.
Observability: Prometheus/Grafana, Loki/ELK.
AI-ориентированный workflow: ежедневный опыт работы с Windsurf/Codex.
Умение писать эффективные промпты и затем проверять, что результат корректный и безопасный.
Git: аккуратные PR, ревью, ветвление, работа с историей.
Google Cloud (GCP): практический опыт со storage, сетями, управлением доступом и managed services (включая GCS).
Proxmox: базовое знакомство (иногда потребуется).
Helm/Kustomize.
Управление секретами: Vault или managed secret store.
Основы безопасности: hardening, сканирование контейнеров (Trivy).
Хранилища и брокеры сообщений: PostgreSQL, Redis, RabbitMQ — с точки зрения эксплуатации.
Английский: умение читать техническую документацию.
100% удаленная работа.
Гибкий график и асинхронная коммуникация.
Оплачиваемый отпуск и больничный.
Доступ к премиальным AI-инструментам.
Упорядоченная рабочая среда без бюрократии.
Intro-звонок: 15–20 минут с HR/рекрутером.
Техническое интервью: live troubleshooting + разбор опыта + короткая часть про организацию работы (~1 час).
Оффер: обычно в течение одной недели.