Наша команда занимается разработкой сервисов и развитием вычислительных и дата платформ для исследования угроз. Мы занимаемся исследованиями и постоянно ищем наиболее оптимальные решения наших задач. Для этого мы используем сотни серверов и петабайты данных, обширный стек технологий. Нам важно создавать надежные, масштабируемыe и высокопроизводительные решения.
Чем предстоит заниматься:
- Поддержка и развитие высоконагруженных распределенных вычислительных платформ компании;
- Предотвращение и устранение аварий, выявление причин возникновения;
- Автоматизация процессов работы с платформами и развитие IaC;
- Развитие мониторинга и логирования на платформах;
- Выполнение требований в области ИБ на платформах.
Что требуется от вас:
- Экспертный уровень знаний linux;
- Опыт работы с:
- K8s (OKD), RBAC, Ceph;
- IaC, предпочтительно Ansible;
- метриками Prometheus/PromQL/Grafana;
- Опыт построения больших отказоустойчивых решений;
- Опыт написания скриптов автоматизации на bash;
- Опыт написания скриптов автоматизации на одном из скриптовых языков ruby/python/etc;
- Опыт сопровождения CI/CD;
- Опыт эксплуатации HAproxy/Nginx + Load balancing.
Будет плюсом:
Опыт работы c:
- Распределенными системами мониторинга;
- ELK стеком;
- Экосистемой Hadoop (Spark/Kafka/Impala/HBase/AirFlow);
- Scylladb;
- ClickHouse;
- Azure DevOps;
- Windows Server, PowerShell;
- Опыт разработки на Java/Golang/Python/Ruby/C;
- Опыт сборки пакетов rpm/deb.