Мы ищем SRE (DevOps-инженера) в контур MAGNIT OMNI, в команду разработки SRE. Наша команда разрабатывает платформу и развивает инструменты для повышения observability. Мы помогаем продуктовым командам находить узкие места в архитектуре, инфраструктуре, коде.
Стек: Linux, Kubernetes, Gitlab, Postgres, Redis, Kafka, VictoriaMetrics, Tempo, Go, Python
Обязанности:
Разработка инструментария для обеспечения надежности, автоматизации и бесперебойной работы информационных систем
Проектирование и поддержание отказоустойчивости архитектуры
Повышение Observability приложений
Проектирование и внедрение метрик мониторинга
Анализ и оперативное реагирование на возникающие инциденты
Межкомандная коммуникация для поиска лучших технических решений
Владение Linux на уровне системного администратора
Опыт написания кода на одном из языков программирования: Go, C#, Python, Java и другие
Понимание принципов построения CI/CD-пайплайнов и IaC-подхода
Хорошая ориентация в ИТ: сетях, работе с данными, протоколах интернета, RPC и другом
Опыт работы с системами контроля версий Git
Опыт работы с Observability инструментарием: системами мониторинга Prometheus; grafana; агрегаторами логов Loki, ELK; системами визуализации и обработки трассировок Tempo, Jaeger, Zipkin etc.; стандартом OpenTelemetry
Понимание принципов работы: реляционных и колоночных баз данных: PostgreSQL, Clickhouse; очередей: RabbitMQ, Kafka; key-value хранилищ: Redis
Опыт работы с системами контейнеризации и оркестрации Docker и k8s