Мы – команда увлеченных профессионалов, которые отвечают за мониторинг всей инфраструктуры облака: от серверов и сетевых устройств до фронтенда.
Наша команда использует передовые технологии и инструменты для автоматизации процессов мониторинга, что позволяет нам быстро реагировать на любые проблемы и предотвращать возможные сбои. Мы также тесно сотрудничаем с другими командами внутри компании, чтобы обеспечить максимальную эффективность работы всей инфраструктуры.
Чем предстоит заниматься:
- Администрирование серверов Linux (Ubuntu).
- Внедрение, сопровождение и развитие стека Opensearch, Vector, Logstash, Kafka.
- Анализ производительности кластеров и оптимизация их работы.
- Настройка, развитие, обеспечение отказоустойчивости высоконагруженных систем.
- Участие в разработке архитектуры, планирование емкости кластеров Opensearch.
- Разработка правил мониторинга и контроля работоспособности систем.
- Написание парсеров и разработка правил корреляции событий для компонентов инфраструктуры.
- Автоматизация типовых операций и управления системами.
- Плотное взаимодействие с командами разработки.
- Выработка стандартов и практик использования инструментов полнотекстового поиска.
- Ведение документации и базы знаний.
Что мы ждём от кандидата:
- Отличное знание Linux.
- Опыт администрирования и траблшутинга кластеров стека Opensearch/ELK, Logstash/Fluentd, Vector, Kafka.
- Опыт эксплуатации любой из систем управления конфигурациями.
- Опыт написания скриптов на Python.
- Опыт работы с регулярными выражениями.
- Опыт работы с git/GitlabCI.
Дополнительно:
- Экспертные знания в стеке ElasticSearch/Opensearch.
- Опыт построения высоконагруженных систем и отказоустойчивых систем.
- Опыт работы с кластерами общим объемом 100+ТБ.
- Понимание задач, решаемых полнотекстовым поиском.
- Опыт работы с кросс-кластерным поиском.
- Опыт работы в Security Operation Center (SOC).