Москва, Пресненская набережная, 12
Привет! Я Катя, занимаюсь подбором в AWX и наконец-то пришел черед найти того самого DevOps-инженера в IT команду компании.
Кто мы: AWX — международная финтех-платформа, создающая передовые решения для управления цифровыми активами и взаимодействия с ними. Наша миссия — дать пользователям инструменты, которые упрощают финансовые операции, повседневные финансовые задачи, делают их безопасными и прозрачными.
Почему сейчас? Потому что твое время пришло...
Потому что проект растет, а задачи становятся сложнее. Нам не достаточно «чтобы просто работало». Нужна надежность, автоматизация и спокойная уверенность в инфраструктуре.
Зеленая зона: Никакого наследия (legacy). Сам выбираешь стек и архитектуру.
Технический вызов: Highload, репликация Postgres, K8s, полная автоматизация бекапов и восстановления.
100% удаленка с гибким графиком (редкие дежурства по инцидентам).
CI/CD с нуля: Настроить GitLab CI, интегрировать с gitflow, написать пайплайны для Maven/pnpm, добавить SAST и линтеры;
Оркестрация и БД: Поднять Kubernetes, настроить репликацию PostgreSQL (Master-Slave), обеспечить автоматическое восстановление;
Наблюдаемость: Развернуть Prometheus + Loki + Grafana. Настроить алерты в Telegram так, чтобы мы узнавали о проблемах раньше пользователей;
DevSecOps: WireGuard, файрволы, Network Policies в K8s, сканирование образов Trivy;
Документирование: Писать runbooks и RCA (анализ инцидентов) — у нас культура «знания в коде и вики».
Опыт: от 4 лет коммерческой работы DevOps в продуктовых компаниях (highload приветствуется);
GitLab CI: Пайплайны, интеграция с gitflow, автоматизация билдов;
Контейнеризация: Docker (безопасность, оптимизация слоев), Kubernetes (деплой, сетевые политики);
Базы данных: PostgreSQL (репликация, бекапы/восстановление);
Мониторинг: Prometheus + Loki + Grafana + Alertmanager;
Скриптинг: Bash или Python для автоматизации бекапов;
Network: Nginx (балансировка);
Будет плюсом: CKA/CKAD, сертификаты по Prometheus/Grafana, опыт с Chaos Engineering (симуляция падений).
Проактивность: Ты замечаешь проблему до алерта. Не ждешь задачу «настроить бекапы» — делаешь это автоматически;
Дисциплина: После настройки сервиса сразу появляется страница в Wiki. RCA — в течение 24 часов после инцидента;
Стрессоустойчивость: Во время аварии действуешь по чек-листу, восстанавливаешь сервис, а не ищете виноватых;
Ответственность: Не бросаешь задачу на 90%. Доводишь до работающего алерта, бекапа и восстановления.
Удаленка: 100%, полная занятость;
Занятость: полная, редкая работа в выходные при инцидентах (по согласованию);
Зарплата: обсуждается с успешным кандидатом (рыночный уровень Senior DevOps);
Команда: взрослые инженеры 30+, без микроменеджмента.
Интервью с HR (20–30 мин);
Техническое интервью с CTO (глубокий разбор кейсов, архитектуры);
Оффер.