Ищем Senior PostgreSQL DBA / DBRE в команду сопровождения TagMe — платформы от Сбера по управлению и созданию данных для машинного обучения.
Роль на 70% сфокусирована на эксплуатации и развитии business critical PostgreSQL-инфраструктуры: production, pre-prod и dev-контуров, высокой доступности, резервного копирования, DR, производительности и автоматизации эксплуатации.
Оставшиеся 30% времени будут посвящены аналогичным задачам, но для S3-хранилищ (объектное хранение данных): мониторинг, управление доступом, жизненный цикл объектов и интеграция с ML-пайплайнами.
Мы сопровождаем высоконагруженные системы с повышенными требованиями к отказоустойчивости, доступности и скорости восстановления. Используем HAProxy, PgBouncer, ELK, мониторинг и инфраструктурную автоматизацию. В команде важны инженерный подход, аккуратность к изменениям и готовность улучшать платформу, а не только поддерживать её в рабочем состоянии.
Обязанности
PostgreSQL (70%):
- сопровождение production / pre-prod / dev БД PostgreSQL в соответствии с SLA/TLA;
- развертывание, обновление и сопровождение PostgreSQL-кластеров;
- проведение minor/major upgrade PostgreSQL с подготовкой плана отката;
- организация и сопровождение резервного копирования, регулярных проверок восстановления;
- участие в построении и сопровождении DR / второй площадки, проведение тестов failover/switchover, контроль RPO/RTO;
- развертывание и refresh pre-prod / test / dev сред, включая перенос и обезличивание данных;
- анализ и оптимизация производительности PostgreSQL (SQL, индексы, autovacuum, bloat, locks, replication lag, connection management, параметры СУБД);
- мониторинг состояния БД и постановка новых систем/функций на мониторинг;
- расследование инцидентов в production, участие в RCA/postmortem;
- capacity planning: расчёт потребностей по CPU, RAM, IOPS, storage, connections;
- автоматизация рутинных операций по сопровождению БД совместно с DevOps/SRE и командой разработки.
S3 / объектное хранение (30%):
- сопровождение и мониторинг S3-совместимых хранилищ, используемых для ML-данных (артефакты, датасеты, бэкапы);
- управление политиками жизненного цикла объектов, версионированием и репликацией;
- обеспечение целостности данных и ротации ключей доступа;
- участие в планировании емкости (capacity planning) для S3-кластеров;
- оптимизация стоимости и производительности объектного хранилища;
- автоматизация рутинных операций с S3 (очистка, миграция, инвентаризация) на Python/Bash.
Требования
Обязательные (PostgreSQL):
- опыт эксплуатации PostgreSQL в production от 3+ лет, желательно в высоконагруженной среде 24/7;
- глубокое понимание архитектуры PostgreSQL (checkpoints, vacuum / autovacuum / analyze, planner / statistics, replication, locks, memory / shared buffers / work_mem, connection management);
- опыт чтения и анализа EXPLAIN (ANALYZE, BUFFERS), работы с pg_stat_statements, поиска узких мест;
- опыт настройки и сопровождения streaming replication, HAProxy, PgBouncer;
- опыт резервного копирования и восстановления PostgreSQL (pg_dump, pg_basebackup, WAL archiving);
- опыт проведения minor/major upgrade PostgreSQL;
- уверенная работа с объектами БД (таблицы, индексы, partitioning, материализованные представления, sequence, триггеры, ограничения);
- опыт администрирования Linux (RHEL/CentOS/Alma/Rocky) на уровне эксплуатации СУБД;
- навыки автоматизации на Bash / Python;
- опыт работы с системами мониторинга и алертинга;
- опыт работы с Ansible/Helm / Git / CI/CD.
Дополнительные (для S3-задач):
- базовое понимание принципов объектного хранения (S3 API, bucket policies, версионирование);
- готовность погрузиться в администрирование S3-совместимых решений (например, Ceph RGW, MinIO, или аналогов), даже если основного коммерческого опыта с ними пока нет.
Будет плюсом:
- опыт сопровождения банковских или иных mission critical систем;
- опыт построения и эксплуатации DR / multi-site решений (как для PostgreSQL, так и для S3);
- опыт работы с Ceph RGW, MinIO или другими S3-совместимыми хранилищами на практике;
- знание PL/pgSQL и опыт написания эксплуатационных SQL/скриптов;
- опыт работы с Terraform и Kubernetes.
Условия
- возможность выбрать удобный формат работы: гибрид или офис
- ежегодный пересмотр зарплаты, годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.