Social Discovery Group (SDG) is the 3rd largest social discovery company in the world, uniting 60+ brands with 500 million users. We solve the problems of loneliness, isolation, and disconnection by transforming virtual intimacy into the new normal. Our portfolio includes online communication platforms focusing on AI, game mechanics, and video streaming - Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki, and others.
We are looking for a Senior Monitoring Engineer (Zabbix/Prometheus).
Your main tasks will be:
Develop and optimize all components of the Zabbix monitoring instance, including provisioning High Availability at different levels.
Ensure SLA compliance through effective monitoring and timely incident response.
Configure monitoring end-to-end (metrics, triggers, alerts, escalations).
Create and modify monitoring templates and Grafana dashboards.
Ensure PostgreSQL backups and high availability for monitoring data.
Improve monitoring quality via retrospective analysis of trigger precision/recall and false-positive reduction.
Generate periodic reports based on data from monitoring systems.
We expect from you:
3+ years as a Senior Zabbix Administrator and Prometheus Administrator (mandatory).
1+ year working with PostgreSQL (mandatory).
Strong hands-on with Zabbix, Prometheus, Grafana (required).
Practical experience with Ansible, Git/GitLab/CI/CD, RPM-based Linux (CentOS/AlmaLinux/RHEL).
Scripting skills in bash and/or Python; PowerShell is a plus.
Ability to own monitoring configuration and continuously raise quality and reliability.
What do we offer:
Social Discovery Group (SDG) — третья по величине компания в мире в сфере social discovery, объединяющая 60+ брендов с аудиторией в 500 миллионов пользователей. Мы решаем проблемы одиночества, изоляции и отсутствия связи, превращая виртуальную близость в новую норму. В наше портфолио входят платформы для онлайн-коммуникации с акцентом на ИИ, игровые механики и видеостриминг: Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki и другие.
Мы ищем Senior Monitoring Engineer (Zabbix/Prometheus).
Ваши задачи:
Разработка и оптимизация всех компонентов инстанса Zabbix, включая обеспечение High Availability на разных уровнях.
Контроль соблюдения SLA за счёт эффективного мониторинга и своевременной реакции на инциденты.
Полная конфигурация мониторинга (метрики, триггеры, алерты, эскалации).
Создание и модификация шаблонов мониторинга и дашбордов в Grafana.
Обеспечение резервного копирования PostgreSQL и высокой доступности данных мониторинга.
Повышение качества мониторинга через ретроспективный анализ точности/полноты (precision/recall) триггеров и снижение числа ложных срабатываний.
Формирование регулярных отчётов на основе данных из систем мониторинга.
Мы ожидаем:
3+ лет опыта в роли Senior Zabbix Administrator и Prometheus Administrator (обязательно).
1+ год работы с PostgreSQL (обязательно).
Уверенное владение Zabbix, Prometheus, Grafana (требуется).
Практический опыт с Ansible, Git/GitLab/CI/CD, RPM-семейством Linux (CentOS/AlmaLinux/RHEL).
Навыки скриптинга на bash и/или Python; знание PowerShell будет плюсом.
Готовность брать на себя ответственность за конфигурацию мониторинга и постоянно повышать его качество и надёжность.
Что мы предлагаем:
Удалённая работа на полный день (REMOTE OPPORTUNITY).
28 календарных дней отпуска в год.
7 wellness-дней в год (оплачиваемое свободное время), которые можно использовать для бытовых дел или отдыха без оформления больничного.
Бонусы до $5000 за рекомендации успешно нанятых специалистов.
Полная оплата профессионального обучения, международных конференций и митапов.
Корпоративная скидка на занятия английским.
Медицинские льготы. Если вы не подходите под корпоративную медстраховку, компания компенсирует до $1000 gross в год на сотрудника (на самостоятельную покупку страховки или оплату врачей для себя и близких — супруг(а), дети).
Организация рабочего места. Компания предоставляет оборудованное рабочее место (стол, кресло, Wi-Fi и т. п.) в наших офисах или коворкингах. В других локациях — компенсация расходов на рабочее место до $1000 gross раз в 3 года по подтверждающим документам (коворкинг или обустройство домашнего рабочего места: стол, кресло, интернет и т. д.).
Внутренняя геймифицированная система благодарностей: получайте бонусы от коллег и обменивайте их на мерч, тимбилдинги, сертификаты на массаж и др.