Настройка и сопровождение кластеров Elasticsearch в production-среде: установка, обновление, бэкапы, восстановление, масштабирование
Обязанности - Парсинг и трансформация разнообразных логов с использованием Logstash, Ingest Pipelines, Vector и других инструментов
- Обеспечение высокой доступности, отказоустойчивости и производительности ELK-инфраструктуры
- Диагностика и устранение инцидентов: анализ проблем с производительностью, поиск утечек памяти, деградации индексов, блокировок
- Внедрение и поддержка проактивного мониторинга
- Автоматизация задач управления инфраструктурой с помощью Ansible и подходов Infrastructure as Code (IaC)
- Работа с безопасностью: управление ролями и политиками доступа
- Оптимизация индексов, шаблонов, ILM-политик, управление жизненным циклом данных
- Поддержка и развитие конвейеров логирования для различных сервисов и команд
- Взаимодействие с разработчиками и с другими командами для улучшения качества логов и диагностики проблем
Требования - Опыт работы с Elasticsearch / OpenSearch в production от 2 лет
- Уверенное знание Kibana и Logstash, понимание принципов построения пайплайнов
- Опыт настройки и эксплуатации Kafka
- Навыки автоматизации через Ansible и подходы IaC
- Опыт работы с Jenkins и c CI/CD-процессами
- Глубокое понимание основ Linux, сетей, файловых систем, безопасности и bash-скриптинга
- Умение работать с Git (ветвление, слияние, merge requests)
- Практический опыт настройки и использования систем мониторинга и алертинга
- Свободное чтение технической документации на английском языке
Преимущества - Опыт работы с Vector или с аналогами (Fluent Bit, Filebeat и др.)
- Владение языком Painless для скриптинга в Elasticsearch
- Навыки программирования на Python, Java или Groovy
- Опыт профилирования и отладки Java-приложений (thread dumps, heap dumps, GC tuning)
- Умение работать с шаблонизатором Jinja2 (в контексте Ansible или конфигураций)
- Понимание принципов observability (логи, метрики, трейсы)