Санкт-Петербург, улица Академика Павлова, 5
Метро: ЛеснаяМы, Мединдекс – медицинская IT компания, которая трансформирует c помощью современных информационных технологий медико-биологическую сферу в России и в ближнем зарубежье.
Мы разрабатываем интеллектуальные решения и сервисы, которые обеспечивают интероперабельность медицинских данных, а также поддерживаем и развиваем ИТ-инфраструктуру компании-лидера в сфере лабораторной диагностики.
Сейчас мы усиливаем нашу инфраструктурную команду и в поисках SRE-инженера.
Какие задачи предстоят:
Какой опыт и знания нам важны:
опыт работы в розничной сети/в компании с высоконагруженными сервисами, высокими требованиями к отказоустойчивости в роли SRE или в смежной инженерной роли, связанной с эксплуатацией production-сервисов;
понимание принципов reliability engineering, observability и incident management;
практический опыт работы с SLA/SLO, error budget и механизмами алертинга;
опыт участия в incident response, root cause analysis и postmortem-процессах;
опыт сопровождения Linux-систем;
опыт эксплуатации vanilla Kubernetes;
владение PowerShell, Bash и Python;
опыт написания Ansible playbooks и использования Jinja2 templates.
навыки анализа инцидентов и деградаций в распределенных системах;
умение работать с технической документацией и вести актуальные operational materials.
Будет плюсом:
опыт работы с VictoriaMetrics, ELK Stack, Grafana Operator, Grafana Agent, Zabbix, InfluxDB, Loki, Mimir и Tempo;
опыт настройки и сопровождения GitLab CI/CD;
опыт разработки и поддержки generic Helm charts;
опыт с S3-compatible storage, TLS/SSL, reverse proxy, load balancing, authentication/SSO, LDAP/SAML/ADFS;
опыт с container runtime: containerd / Docker;
понимание networking: DNS, TCP/IP, HTTP(S), TLS, ingress, proxy, load balancing;
опыт с GitOps, IaC и автоматизацией инфраструктуры;
знание security best practices: secrets management, least privilege, certificate rotation
Мы предлагаем: