В Nomium - мы создаем масштабные блокчейн-проекты с высоконагруженными системами. Сегодня нас 40+ человек, работающих по всему миру. Мы строим инфраструктуру как продукт: прозрачный, отказоустойчивый и полностью автоматизированный.
У нас настоящий High-load: интенсивные потоки транзакций и строгие требования к стабильности. Если ты считаешь, что любая правка руками в проде - это ошибка, а GitOps - единственный верный путь, нам точно по пути.
Чем предстоит заниматься:
Надежность и эксплуатация
Эксплуатация Kubernetes-контуров: стабильность, обновления, политика изменений.
SLO/алерты/реакция на инциденты: снижение MTTR через runbook’и, метрики, понятные процедуры.
Диагностика «почему упало/тормозит» на уровне инфраструктуры, сети, приложений и баз (в зоне DevOps).
CI/CD и доставка
Развитие GitLab CI: шаблоны, унификация, ускорение сборок, контроль артефактов/образов, предсказуемые релизы.
Доставка в Kubernetes через ArgoCD: GitOps, promotion между окружениями, контроль drift’а.
Формализация релизного процесса: версии, откаты, миграции, чек-листы.
IaC и конфигурация
Поддержка и развитие инфраструктуры в Terraform (Yandex Cloud) и конфигураций в Ansible.
Стандартизация: структура репозиториев, модули, переменные, секреты, окружения.
Observability и инцидент-менеджмент
Мониторинг и логи: Prometheus + Grafana, Loki, Tempo, CoRoot.
Улучшение сигналов: алерты без шума, корректные лейблы, дашборды под инциденты и capacity planning.
Практика «увидел → понял → сделал → зафиксировал»: документация и runbook’и.
Платформенная эксплуатация данных
Managed PostgreSQL и managed ClickHouse: бэкапы, ретеншн/ротации, лимиты, мониторинг, отказоустойчивость.
RabbitMQ / Redis (dev и PROD): стабильность, наблюдаемость, типовые аварии, capacity.
Безопасность в DevOps-контуре
Базовая безопасность: секреты, доступы, разграничение прав, контроль образов, минимизация blast radius.
Security-практики в CI/CD без «театра безопасности», только рабочие меры.
Активное участие в поддержке инфраструктуры, возможны ночные дежурства (в перспективе и с отдельной компенсацией).
Требования:
Senior-уровень в эксплуатации прод-инфраструктуры на Kubernetes.
Уверенная работа с Terraform и понимание жизненного цикла изменений.
Уверенная настройка и поддержка CI/CD на GitLab CI с доведением до стандарта.
Опыт построения observability (метрики/логи/трейсы) и расследования инцидентов по сигналам.
Понимание эксплуатации Postgres/ClickHouse на уровне платформы: бэкапы, ретеншн, лимиты, мониторинг, типовые проблемы.
Навык писать понятные runbook’и и автоматизировать рутину.
Привычка фиксировать знания в репозиториях: IaC, документация, runbook’и.
Командная работа и обмен опытом.
Будет плюсом:
Yandex Cloud: IAM, VPC, security groups, Managed Kubernetes, Container Registry/Lockbox (или аналоги).
Nginx/HAProxy.
Практики: SLO/SLI, incident management, postmortem, capacity planning.
Опыт поддержки high-load систем.
Условия и бонусы:
Интересные и технологичные проекты: создание и развитие блокчейн-проектов с экстремальными нагрузками, где ты сможешь внедрять передовые подходы (GitOps, eBPF-мониторинг) в профессиональной среде.
Глобальная команда: 40+ специалистов по всему миру, культура доверия, автономии и отсутствие бюрократии.
Remote-first: полная удаленка, работай из любой точки мира.
Гибкость и развитие: фокус на результат, участие в жизни SRE-сообщества и работа с современным стеком.
Занятость: Full-time.
Доход: обсуждается по результатам интервью.
Карпинский Виктор Александрович
Минск
до 4000 USD
Иностранное унитарное предприятие Адмитад
Минск
до 4000 USD
Минск
до 300000 RUR