Senior DevOps engineer

Москва, Пресненская набережная, 12

Описание вакансии

Привет! Я Катя, занимаюсь подбором в AWX и наконец-то пришел черед найти того самого DevOps-инженера в IT команду компании.

Кто мы: AWX — международная финтех-платформа, создающая передовые решения для управления цифровыми активами и взаимодействия с ними. Наша миссия — дать пользователям инструменты, которые упрощают финансовые операции, повседневные финансовые задачи, делают их безопасными и прозрачными.

Почему сейчас? Потому что твое время пришло...
Потому что проект растет, а задачи становятся сложнее. Нам не достаточно «чтобы просто работало». Нужна надежность, автоматизация и спокойная уверенность в инфраструктуре.

Почему это интересно:

Зеленая зона: Никакого наследия (legacy). Сам выбираешь стек и архитектуру.
Технический вызов: Highload, репликация Postgres, K8s, полная автоматизация бекапов и восстановления.
100% удаленка с гибким графиком (редкие дежурства по инцидентам).

Чем предстоит заниматься (реальные задачи)

Строить:

CI/CD с нуля: Настроить GitLab CI, интегрировать с gitflow, написать пайплайны для Maven/pnpm, добавить SAST и линтеры;
Оркестрация и БД: Поднять Kubernetes, настроить репликацию PostgreSQL (Master-Slave), обеспечить автоматическое восстановление;
Наблюдаемость: Развернуть Prometheus + Loki + Grafana. Настроить алерты в Telegram так, чтобы мы узнавали о проблемах раньше пользователей;
DevSecOps: WireGuard, файрволы, Network Policies в K8s, сканирование образов Trivy;
Документирование: Писать runbooks и RCA (анализ инцидентов) — у нас культура «знания в коде и вики».

Что для нас важно (Must have):

Опыт: от 4 лет коммерческой работы DevOps в продуктовых компаниях (highload приветствуется);
GitLab CI: Пайплайны, интеграция с gitflow, автоматизация билдов;
Контейнеризация: Docker (безопасность, оптимизация слоев), Kubernetes (деплой, сетевые политики);
Базы данных: PostgreSQL (репликация, бекапы/восстановление);
Мониторинг: Prometheus + Loki + Grafana + Alertmanager;
Скриптинг: Bash или Python для автоматизации бекапов;
Network: Nginx (балансировка);
Будет плюсом: CKA/CKAD, сертификаты по Prometheus/Grafana, опыт с Chaos Engineering (симуляция падений).

Будет классно поймать и мэтч по софтам:

Проактивность: Ты замечаешь проблему до алерта. Не ждешь задачу «настроить бекапы» — делаешь это автоматически;
Дисциплина: После настройки сервиса сразу появляется страница в Wiki. RCA — в течение 24 часов после инцидента;
Стрессоустойчивость: Во время аварии действуешь по чек-листу, восстанавливаешь сервис, а не ищете виноватых;
Ответственность: Не бросаешь задачу на 90%. Доводишь до работающего алерта, бекапа и восстановления.

Условия работы

Удаленка: 100%, полная занятость;
Занятость: полная, редкая работа в выходные при инцидентах (по согласованию);
Зарплата: обсуждается с успешным кандидатом (рыночный уровень Senior DevOps);
Команда: взрослые инженеры 30+, без микроменеджмента.