Мы строим Платформу данных — высоконагруженную среду для обработки и хранения критически важной информации. Это не просто «еще один DWH»: мы создаем инфраструктуру, которая обеспечивает аналитику и принятие решений в масштабах, близких к реальному времени.
Почему мы ищем специалиста именно сейчас?
На проекте отсутствует профильный эксперт по базам данных. До сих пор администрирование БД было «точечной» задачей для системных инженеров, но сейчас нагрузка и сложность запросов выросли настолько, что нам нужен dedicated-специалист, который возьмет на себя полный цикл управления данными: от архитектуры ODS-слоя до тонкой настройки мониторинга и отказоустойчивости.
Стек ядра:
Linx · Greenplum (6.x+) · PostgreSQL · pgBouncer · Prometheus + Grafana
Методологии:
Мы работаем по гибкой DevOps-модели. Команда сама определяет, как и когда делать релизы, использует инфраструктуру как код, практикует blameless post-mortems и непрерывное улучшение процессов.
В ближайшие 3-6 месяцев команда усилится:
Благодаря вам (роль DBA) и еще одному Data Engineer. Вы станете ключевым экспертом по БД, вокруг которого будет строиться expert-область.
Чем предстоит заниматься:
- Проектировать и эволюционировать базы данных (особое внимание — ODS-слой для MDM)
- Управлять кластером Greenplum: масштабировать сегменты, балансировать данные, настраивать под OLAP-нагрузки
- Настраивать и сопровождать pgBouncer (пулы, транзакционный режим, мониторинг)
- Разворачивать и масштабировать PostgreSQL: от сингл-сервера до кластера с репликацией
- Внедрять продвинутый мониторинг через Prometheus + Grafana (метрики, дашборды, алерты)
- Проводить аудит текущей конфигурации и давать письменные road-карты улучшений
- Управлять доступом, шифрованием, бекапами (gpbackup, PITR, pg_basebackup)
- Документировать архитектуру и изменения (чтобы знания не умирали вместе с сессией SSH)
Чего мы ждем от тебя:
- Коммерческая работа с Greenplum 6.x+ не менее 2 лет
- Глубокий опыт с PostgreSQL от 2 лет: MVCC, WAL, vacuum, locks, query planner — на уровне «почему план запроса именно такой»
- pgBouncer в связке с Greenplum/PostgreSQL: транзакционный режим, управление пулами, диагностика
- Управление ролями, привилегиями, защита от несанкционированного доступа
- Тонкая настройка GP под OLAP-нагрузки
- Мониторинг через Prometheus + Grafana (сбор метрик соединений, долгих запросов, утилизации сегментов)
- Репликация PostgreSQL (streaming / logical) и зеркалирование сегментов Greenplum
- Backup / restore: pg_dump, pg_basebackup, gpbackup/gprestore, PITR
- Опыт развертывания ODS-слоя для быстрых операций поверх PostgreSQL
- Способность аудитить существующую БД и выдавать письменные рекомендации
- Знание Airflow на уровне диагностики его мета-БД: блокировки, очистка таблиц, пулы соединений
- Оптимизация сложных SQL (оконные функции, CTE, партиционирование, анализ планов)
- Желательный опыт (будет большим плюсом):
- Понимание архитектуры lakehouse (Iceberg, Delta Lake) с метаданными на PostgreSQL
- Миграция в облако (любой опыт)
- Работа с Microsoft SQL Server в контексте аудита схем, индексов, хранимых процедур — особенно если это связано с метаданными Power BI
- Диагностика подключений и оптимизация запросов для Power BI
- Опыт перехода с классического DWH / Data Lake на lakehouse
- Знание дополнительных СУБД (любых)