Мы в поиске DevOps-инженера который будет внедрять и развивать системы observability в страховой компании.
Наш будущий кандидат, обрати внимание, что формат работы офисный 5/2
Чем предстоит заниматься:
- Внедрять и развивать системы observability (метрики, логи, трассировки, алертинг).
- Настраивать и поддерживать стек мониторинга (Prometheus, Grafana, Loki, Tempo, VictoriaMetrics).
- Реализовывать централизованно сбор данных через OpenTelemetry, Fluent Bit, Filebeat.
- Строить конвейеры обработки и доставки данных мониторинга.
- Разрабатывать и поддерживать дашборды и алерты для различных команд.
- Интегрировать инструменты мониторинга в CI/CD пайплайны (GitLab CI, GitHub Actions).
- Управлять инфраструктурой мониторинга в Kubernetes (Helm, Kustomize).
- Участвовать в расследовании инцидентов и проведении post-mortem анализов.
Для нас важно:
- Опыт работы в роли DevOps/SRE/Platform Engineer от 2-3 лет.
- Практический опыт работы с Prometheus/VictoriaMetrics для сбора метрик.
- Навыки работы с Loki/Elasticsearch для централизованного логирования.
- Опыт настройки Tempo/Jaeger для распределенной трассировки.
- Умение работать с Alertmanager/Zabbix для настройки алертинга.
- Знание OpenTelemetry для унифицированного сбора телеметрии.
- Опыт работы с Kubernetes (деплой, масштабирование, observability).
- Навыки использования Helm/Kustomize для управления конфигурациями.
- Уверенное владение Linux и bash-скриптингом.
- Опыт интеграции мониторинга в CI/CD пайплайны (GitLab CI/GitHub Actions).
- Способность документировать решения и процессы.
Будет плюсом:
- Понимание принципов SRE (SLO/SLI/SLA).
- Опыт работы с Sentry для мониторинга ошибок.
- Знание Terraform/Ansible для автоматизации.
- Базовые навыки программирования на Python/Go.