Калуга, улица Гагарина, 1
Обязанности:
Обеспечение высокой доступности, отказоустойчивости и производительности инфраструктуры и сервисов.
Разработка и реализация стратегий надёжности: SLA, SLO, SLI, error budgets, alerting.
Построение и развитие систем мониторинга, логирования и трассировки: Prometheus, VictoriaMetrics, Grafana;
ELK (Elasticsearch, Logstash, Kibana), Homer.
Реализация и сопровождение CI/CD-процессов и DevOps-практик: Jenkins, Bitbucket.
Автоматизация инфраструктуры по принципам Infrastructure as Code (IaC): Ansible и др.
Поддержка полного жизненного цикла сервисов во всех окружениях: Dev, Test, UAT, Prod.
Участие в релизах, выкладке новых версий, обеспечение обратной совместимости.
Администрирование и сопровождение высоконагруженных (high-load) систем.
Сопровождение и эксплуатация кластеров PostgreSQL:
с использованием Patroni, PgBouncer, HAProxy, Keepalived.
Анализ инцидентов и деградаций, устранение узких мест в инфраструктуре.
Обеспечение резервного копирования, отказоустойчивости и горизонтального масштабирования.
Работа в тесной связке с командами разработки, безопасности и эксплуатации.
Участие в управлении кодовой базой и релизным циклом через Git: Pull/Merge Requests, Code Review, ветвление, CI-триггеры.
Требования:
Опыт в роли DevOps / SRE от 5 лет.
Глубокое знание Linux-систем (Debian, Ubuntu, CentOS).
Владение языками: Bash, Python (Go — будет плюсом).
Уверенный опыт с PostgreSQL, включая работу с кластерами:
Настройка, репликация, бэкапы, кластеризация;
Использование Patroni, HAProxy, Keepalived, PgBouncer.
Опыт эксплуатации и оптимизации высоконагруженных (high-load) систем.
Опыт внедрения и сопровождения систем мониторинга и логирования:
Prometheus, Grafana, ELK, VictoriaMetrics, Homer.
Практика с CI/CD-платформами: Jenkins, Bitbucket.
Знание и уверенное применение Git:
Опыт работы с Git workflow’ами (feature-branch, trunk-based, Git Flow и др.).
Опыт работы с контейнерами и оркестрацией: Docker, Kubernetes (желательно).
Владение инфраструктурной автоматизацией: Ansible.
Умение читать и разбираться в технической документации на английском языке.
Будет плюсом:
Опыт работы с IP-телефонией:
Диагностика и настройка VoIP-оборудования;
Анализ SIP-дампов, устранение сбоев в телефонном трафике.
Знание сетевых технологий и протоколов:
Стек TCP/IP, DNS, DHCP, FTP, UDP, TCP, SIP, SNMP, MRCP, SDP, SMPP;
Принципы маршрутизации, NAT, VLAN, VPN.
Опыт настройки и эксплуатации телекоммуникационного оборудования:
АТС, IVR-системы, речевые движки, чат-боты и др.
Опыт работы в high-availability и distributed-средах.
Знание и применение SRE-метрик (SLA, SLO, SLI), практик error budgets и мониторинга бизнес-метрик.
Условия:
Возможность офисного или удалённого формата работы.
Аккредитованная IT компания, возможность отсрочки от мобилизации.
Конкурентоспособная официальная заработная плата.
Полная занятость.
Оформление по ТК РФ.
8-часовой рабочий день, гибкий график, удаленный формат.
Возможна работа на территории работодателя в центре города (у нас есть вся инфраструктура для развития и креатива в работе).
Белая заработная плата (размер заработной платы — по результатам собеседования).
Оформление, отпуск, больничный, бронь и пр. по ТК РФ. Ответственная работа в команде разработчиков-профессионалов, въедливых аналитиков, тестировщиков-зануд (в лучшем смысле этого слова ツ) и заботливых менеджеров (строгих, но справедливых).
Огромное количество новой информации, интересные разнообразные задачи, реальная возможность прокачать свои навыки.
Большой и дружный коллектив.
Корпоративные мероприятия.
О компании
АО «Эксперт Солюшнс» работает на российском рынке с 2002 года и является одним из ведущих разработчиков специального программного обеспечения для центров обслуживания вызовов (ЦОВ), интеллектуальных платформ и других систем массового дистанционного обслуживания.
Наши решения используются более чем в 170 российских и зарубежных компаниях.