Мы ищем DevOps-инженер ( NoSQL) / DBA в команду Tortuga Platform — инженера, который поможет развивать и масштабировать платформенные NoSQL-сервисы компании. Эта роль подойдет специалисту, которому интересно не только администрирование Redis и MongoDB, но и построение надежной инфраструктурной платформы: автоматизация, observability, отказоустойчивость, безопасность и developer self-service.
Чем придется заниматься
- Проектировать и развивать HA-кластеры Redis и MongoDB, обеспечивать отказоустойчивость, масштабируемость и производительность платформенных NoSQL-сервисов
- Эксплуатировать production NoSQL-инфраструктуру: replication, failover, backup/recovery, обновления, оптимизация конфигураций и troubleshooting производительности
- Разрабатывать automation tooling и IaC-решения на Python/Ansible, участвовать в code review и развитии инженерных стандартов команды
- Интегрировать NoSQL-сервисы в платформенную экосистему: Kubernetes, Crossplane, Vault, PKI, балансировка, observability и CI/CD
- Развивать мониторинг и observability стек: метрики, алертинг, аудит-логи, SLO/SLA и анализ состояния NoSQL-кластеров
- Проводить RCA сложных инцидентов, участвовать в on-call и устранять проблемы производительности и стабильности distributed systems
- Формировать технические стандарты эксплуатации NoSQL-систем: backup policies, security practices, monitoring approaches и архитектурные решения.
- Вести техническую документацию (ADR, runbooks, Docs as Code), проводить техсессии и развивать экспертизу команд в области NoSQL
Требования - Опыт работы от 3+ лет с Redis в production: replication, clustering, RDB/AOF, Redis Cluster, Sentinel, memory optimization и troubleshooting производительности
- Уверенные знания Linux и понимание архитектуры distributed systems: replication, failover, consistency guarantees, RCA, диагностика и оптимизация production-среды
- Практический опыт работы с observability-стеком: Prometheus/VictoriaMetrics, Grafana, Alertmanager, мониторинг и анализ метрик NoSQL-систем
- Опыт разработки automation tooling на Python, написания Ansible roles/playbooks, работы с GitLab CI/CD, Docker и Kubernetes
- Опыт эксплуатации MongoDB: Replica Set, Sharded Cluster, backup/recovery, индексы, aggregation framework и sharding strategies
- Системное мышление, опыт написания ADR/runbooks и понимание security-практик: TLS/mTLS, ACL, RBAC