Мы – команда увлеченных профессионалов, которые отвечают за мониторинг всей инфраструктуры облака: от серверов и сетевых устройств до фронтенда.
Наша команда использует передовые технологии и инструменты для автоматизации процессов мониторинга, что позволяет нам быстро реагировать на любые проблемы и предотвращать возможные сбои. Мы также тесно сотрудничаем с другими командами внутри компании, чтобы обеспечить максимальную эффективность работы всей инфраструктуры.
Чем предстоит заниматься:
- Администрирование серверов Linux (Ubuntu);
- Внедрение, сопровождение и развитие стека Opensearch, Vector, Logstash, Kafka;
- Анализ производительности кластеров и оптимизация их работы;
- Настройка, развитие, обеспечение отказоустойчивости высоконагруженных систем;
- Участие в разработке архитектуры, планирование емкости кластеров Opensearch;
- Разработка правил мониторинга и контроля работоспособности систем;
- Написание парсеров и разработка правил корреляции событий для компонентов инфраструктуры;
- Автоматизация типовых операций и управления системами;
- Плотное взаимодействие с командами разработки;
- Выработка стандартов и практик использования инструментов полнотекстового поиска;
- Ведение документации и базы знаний.
Что мы ждём от кандидата:
- Отличное знание Linux;
- Опыт администрирования и траблшутинга кластеров стека Opensearch/ELK, Logstash/Fluentd, Vector, Kafka;
- Опыт эксплуатации любой из систем управления конфигурациями;
- Опыт написания скриптов на Python;
- Опыт работы с регулярными выражениями;
- Опыт работы с git/GitlabCI.
Дополнительно:
- Экспертные знания в стеке ElasticSearch/Opensearch;
- Опыт построения высоконагруженных систем и отказоустойчивых систем;
- Опыт работы с кластерами общим объемом 100+ТБ;
- Понимание задач, решаемых полнотекстовым поиском;
- Опыт работы с кросскластерным поиском;
- Опыт работы в Security Operation Center (SOC).