Сопровождение ключевой системы автоматизации работы с розничными клиентами в Совкомбанке, которая обеспечивает: открытие/ведение счетов и вкладов, кредитование (рассмотрение заявок, выдачи, обслуживание), денежные переводы и платежи, работу с банковскими картами, клиентский сервис и аналитику.
Стек:
Linux (HardServer - RedOS, Docker - alpine); Kubernetes, Docker, GitLab CI/CD; ELK, Graylog; PostgreSQL; Prometheus, Zabbix, ELK, Graylog. Интеграции - gRPC, REST API, внутренние сервисы банка
Обязанности:
- Поддержка инфраструктуры
- Обеспечение отказоустойчивости кластеров и сервисов
- Мониторинг (реактивный и проактивный), настройка алертов
- Расследование инцидентов, RCA, постмортемы
- Управление нагрузкой и масштабированием Развитие системы
- Оптимизация производительности (latency, throughput)
- Автоматизация развертывания, CI/CD пайплайны
- Обеспечение высоких показателей SLA/SLO/SLI
- Участие в design reviews новых сервисов
- Подготовка и обновление runbooks/документации
- Тестирование восстановления после сбоев (disaster recovery)
Требования: - Опыт работы в SRE/DevOps, желательно в банковской сфере
- Глубокие знания Linux (уровень системного администратора), опыт работы с контейнеризацией (Docker, Kubernetes)
- Уверенное владение SQL (PostgreSQL или MS SQL), понимание принципов работы СУБД
- Опыт работы с системами мониторинга и агрегации логов (Prometheus, Zabbix, ELK, Graylog)
- Способность быстро принимать решения в условиях сбоев, проводить RCA и восстанавливать сервисы
- Опыт автоматизации процессов, написания скриптов (Bash, Python)
- Документирование (Написание инструкций, архитектуры и runbook)
- Готовность к on-call на случай инцидентов и тех.работ
- Практический опыт настройки и использования GitLab CI/CD
- Понимание микросервисной архитектуры и принципов построения отказоустойчивых систем
- Опыт работы с инфраструктурой как код (IaC), оркестрацией (Kubernetes, ArgoCD, Rancher)
- Знание сетевых технологий (OSI, Nginx, HAProxy) и инструментов безопасности (Vault)
Условия: