Санкт-Петербург, Выборгская набережная, 47
Метро: ВыборгскаяМы ищем инженера, который возьмёт на себя архитектурную и операционную ответственность за PostgreSQL-инфраструктуру, лежащую в основе наших аналитических и ML-систем. Эта роль — не администрирование, а проектирование надёжной, масштабируемой и предсказуемой среды для работы с данными, при этом полностью освобождая разработчиков и дата-сайентистов от необходимости взаимодействовать с БД напрямую.
Наши данные — это не просто таблицы. Это:
карта грузоперевозок в реальном времени,
история взаимодействий с клиентами,
обогащённые события, используемые в моделях машинного обучения.
Если поток данных нарушается, даже незаметно, очередь в RabbitMQ исчезает, партиция не создаётся, ETL зависает. Это напрямую влияет на качество решений, принимаемых как системами, так и людьми. Мы не допускаем ситуаций, когда данные молча становятся неполными или устаревшими. Твоя задача — построить систему, в которой такие сценарии либо невозможны, либо мгновенно обнаруживаются.
Основные обязанности:
Проектирование и развитие архитектуры PostgreSQL-кластеров (схемы, базы, партиционирование, репликация);
Обеспечение целостности, доступности и производительности данных при объёмах >5 ТБ и таблицах >500 ГБ;
Разработка и поддержка агрегатных таблиц, материализованных представлений и хранимых процедур, используемых в аналитике и ML;
Настройка мониторинга не только инфраструктурных метрик, но и семантической полноты данных (например: «поступают ли новые записи в таблицу X?»);
Автоматизация жизненного цикла БД через IaC (Ansible, GitLab CI): развёртывание, бэкапы, восстановление, проверка отказоустойчивости;
Ревью изменений в схемах, контроль за качеством запросов, оптимизация производительности (индексы, планировщик, VACUUM/ANALYZE, настройка postgresql.conf);
Документирование архитектурных решений, процессов и процедур.
Что мы ожидаем:
Глубокое понимание PostgreSQL: внутреннее устройство, управление памятью, WAL, MVCC, работа планировщика, тонкости партиционирования;
Практический опыт работы с высоконагруженными кластерами и большими объёмами данных;
Умение проектировать масштабируемую структуру БД: грамотное распределение по схемам и базам, избегание анти-паттернов;
Опыт автоматизации через IaC, но с пониманием границ применимости — не всё должно быть кодом;
Способность чётко объяснять инженерам и аналитикам, почему то или иное решение в БД критично — без жаргона, но без упрощений;
Готовность работать на стыке Data Engineering, DevOps и Data Science.
MSSQL, MongoDB, ClickHouse — присутствуют в стеке, но PostgreSQL — основной фокус и зона ответственности.
Почему эта роль значима:
Ты не будешь реагировать на инциденты — ты построишь систему, в которой их не возникает;
Твои решения напрямую влияют на то, насколько точно продукт «видит» реальность;
Разработчики и ML-инженеры не взаимодействуют с БД — потому что ты обеспечиваешь им готовые, надёжные и эффективные интерфейсы к данным.
Бонусы, которые мы предоставляем:
Друзья, пожалуйста, обратите внимание: у нас гибридный формат работы. Это значит, что дважды в неделю нужно будет приезжать в офис, который находится в Петербурге. Полностью удалённая работа у нас не предоставляется.
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
Не указана
Центральный банк Российской Федерации (Банк России)
Санкт-Петербург
до 260000 RUR
Санкт-Петербург
до 260000 RUR