«М.ТЕХ» - АККРЕДИТОВАННАЯ ИТ-КОМПАНИЯ В ГРУППЕ «М.ВИДЕО-ЭЛЬДОРАДО».
КОМАНДА «М.ТЕХ» разрабатывает более 100 инновационных ИТ продуктов на основе современной микросервисной и облачной инфраструктуры, больших данных, биометрии, ИИ и машинного обучения для улучшения качества жизни десятков тысяч сотрудников и миллионов покупателей по всей России.
Цель позиции
Построение и управление инфраструктурой как кода для высокодоступных кластеров PostgreSQL и ClickHouse. Обеспечение автоматизированного развертывания,
резервного копирования, мониторинга и быстрого восстановления баз данных в production-окружении.
МЫ В ПОИСКЕ ИНЖЕНЕРА ПО АВТОМАТИЗАЦИИ DBA
ТЕБЕ ПРЕДСТОИТ:
PostgreSQL
- Автоматизация кластеров: проектирование и реализация автоматизированного развертывания кластеров PostgreSQL с высокой доступностью под нагрузкой (1000+ TPS);
- Кластеризация: настройка и поддержка Patroni + etcd/consul, streaming replication, logical replication, switchover/failover без потери данных;
- Performance tuning: глубокая оптимизация параметров PostgreSQL, настройка VACUUM, ANALYZE, работа с pg_stat_statements, диагностика медленных запросов;
- Connection pooling: настройка и мониторинг PgBouncer в транзакционном режиме, изоляция пулов между сервисами;
- Backup/restore: реализация стратегий резервного копирования через pgBackRest/WAL-G, Point-in-Time Recovery, тестирование восстановления.
ClickHouse
- Кластеризация: автоматизация развертывания шардированных и реплицированных кластеров ClickHouse, настройка ClickHouse Keeper (или ZooKeeper);
- Distributed tables: проектирование схемы данных, шардирование, настройка Distributed движков, балансировка запросов;
- Performance optimization: tuning MergeTree, настройка индексов, партционирование, материализованные представления, оптимизация INSERT/SELECT под нагрузкой.
CI/CD и автоматизация
- CI/CD для миграций: построение конвейеров для автоматизированного применения schema migrations (flyway, liquibase, custom tools) с zero-downtime подходом;
- Автоматизация релизов: интеграция DB changes в GitOps-процессы, версионирование структур БД, автоматический деплой в тестовые стенды;
- IaC: разработка Terraform модулей для провижининга инфраструктуры БД (VM, диски, сети), Ansible роли для настройки всех компонентов;
- Тестовые стенды: автоматизация создания/удаления динамических окружений с аналогом production данных для тестирования.
Мониторинг и эксплуатация
- Мониторинг: построение дашбордов в Grafana, настройка Prometheus exporters (postgres_exporter, clickhouse_exporter), алерты на ключевые метрики;
- Troubleshooting: быстрая диагностика производственных инцидентов (переполнение диска, замирание репликации, DeadLocks, OOM);
- Migrations: автоматизация мажорных апгрейдов PostgreSQL/ClickHouse с минимальным downtime.
ЧТО МЫ ОЖИДАЕМ ОТ КАНДИДАТА:
- PostgreSQL: 3+ лет администрирования production кластеров (13+ версии), глубокое понимание MVCC, WAL, репликации;
- ClickHouse: 1.5+ лет опыта с кластерами в production, понимание MergeTree, шардирования, distributed queries;
- Linux: Expert level (kernel parameters, I/O scheduler, NUMA, network tuning для низкой задержки);
- IaC: Terraform — написание модулей, работа с remote state, импорт существующей инфраструктуры;
- CM: Ansible — роли, плейбуки, jinja2, vault, performance optimization;
- Сеть: TCP/IP, коннект-таймауты, keepalive, диагностика сетевых проблем между нодами кластера;
- Мониторинг: Prometheus + Grafana, alertmanager, опыт написания recording/alerting rules;
- Git: Advanced git, GitOps флоу для конфигураций БД;
- Bash: написание сложных скриптов для автоматизации, отладка, работа с API;
- Python: разработка CLI-утилит, автоматизация задач, работа с API (Patroni REST API, ClickHouse HTTP API), тестирование кода;
- Golang: чтение и понимание кода инструментов экосистемы, написание простых утилит, кастомных экспортеров метрик;
- Понимание CAP теоремы и trade-offs для PostgreSQL и ClickHouse
Опыт работы с инцидентами: ability to debug complex distributed database systems; - Знание паттернов SRE: SLI/SLO/SLA для БД (RTO/RPO);
- Понимание безопасности: шифрование at rest/in transit, разграничение доступа.
ЧТО ТЫ ПОЛУЧИШЬ:
- Продукты, признанные на рынке (несколько премий за Лучший Интранет, хит-парад премий за лучшее ИТ-решение в ритейле) и имеющие амбициозные планы на развитие;
- Конструктивный диалог и возможность внедрять свои идеи, если они способствуют достижению общего результата;
- Команду увлеченных профессионалов, которая открыта к поиску нового;
- Конкурентную заработную плату, гибкое отношение к рабочему месту (посещение офиса в Москве на гибриде (Сколково, БЦ Орбион), но ты можешь работать удаленно из любой точки РФ);
- ДМС со стоматологией.