Проект FlexCard — сервис виртуальных банковских карт для оплаты рекламы и онлайн-сервисов. Мы создаём удобные и безопасные платёжные решения для рекламодателей, маркетинговых команд и бизнеса, которым нужны стабильные инструменты для закупки трафика и работы с международными площадками.
Основные задачи:
- Проектирование и поддержание отказоустойчивой инфраструктуры продукта (виртуальные серверы, сети, базы данных).
- Внедрение и развитие CI/CD пайплайнов для автоматического и безопасного развертывания кода.
- Перевод конфигураций серверов в код (Infrastructure as a Code) для исключения ручных правок на продуктивном контуре (Terraform, Ansible).
- Построение проактивного мониторинга, сбор метрик и настройка алертинга (чтобы узнавать о проблемах до клиентов).
- Разработка стратегии миграции сервисов в контейнерную среду (Docker, Kubernetes) по мере роста нагрузки.
- Администрирование критических компонентов: MariaDB (Galera Cluster), Kafka (при внедрении).
- Расследование инцидентов, работа над повышением отказоустойчивости сервиса (SLO/SLA, error budget).
Знания, необходимые для выполнения данной работы:
- Устройство сетей в Linux (TCP/IP, iptables, маршрутизация).
- Принципы построения отказоустойчивых систем (репликация, резервирование).
- Понимание жизненного цикла разработки ПО и роли инфраструктуры в нем.
- Основы SRE: SLA, SLO, управление инцидентами, post-mortem анализ.
- Важно: Понимание, что инфраструктура — это код, а не набор ручных конфигураций.
Будет плюсом:
- Docker, опыт с системами оркестрации (Kubernetes), знание Terraform/Ansible.
Необходимые навыки:
- Умение «копать» глубоко: диагностировать проблемы не по поверхностным симптомам, а на уровне ядра или запросов.
- Навыки написания скриптов для автоматизации рутины.
- Умение читать и понимать чужой код (чтобы помогать разработчикам с деплоем).