Head of Monitoring group

Social Discovery Group

Head of Monitoring group

Описание вакансии

Social Discovery Group (SDG) is the 3rd largest social discovery company in the world, uniting 60+ brands with 500 million users. We solve the problems of loneliness, isolation, and disconnection by transforming virtual intimacy into the new normal. Our portfolio includes online communication platforms focusing on AI, game mechanics, and video streaming - Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki, and others.

We are looking for a Head of IT Monitoring Team to lead two teams—24/7 Duty Admins (L1) and Technical Monitoring Specialists—and to design, develop, implement, and operate a comprehensive monitoring service that ensures stability, performance, and security of our IT infrastructure and products.

Your main tasks will be:

  • Provide strategic leadership, set team goals aligned with company objectives, and own the roadmap for advancing monitoring capabilities.

  • Build, operate, and evolve the monitoring stack (Zabbix, Grafana, Prometheus and others) with strong support for microservices and cloud monitoring (AWS CloudWatch / Azure Monitor / Google Cloud Monitoring).

  • Ensure timely detection and resolution of alerts, increasing the share of incidents resolved by the L1 duty team without escalation; establish procedures based on ITIL and manage SLAs.

  • Collaborate with IT/product teams to smoothly transition new monitoring solutions into production, and maintain clear operational documentation and runbooks.

  • Develop people: upskill teammates, define a transparent career ladder, and prepare regular reports with operational metrics and team results.

We expect from you:

  • Proven leadership running monitoring/observability teams in companies with high-loaded web systems.

  • Strong knowledge of monitoring protocols, tools (Zabbix, Grafana, Prometheus), methodologies, and best practices; proficiency in monitoring microservices.

  • Hands-on experience with RCA practices for critical events and with cloud monitoring (CloudWatch, Azure Monitor, Google Cloud Monitoring).

  • Excellent communication skills and responsibility; experience building teams, developing people, and giving regular feedback; English B2+.

  • Nice to have: ITIL Foundation certification; familiarity with AIOps and AI-driven monitoring; full-stack development experience to build internal tools, integrations, and dashboards.

What do we offer:

  • REMOTE OPPORTUNITY to work full time;
  • Vacation 28 calendar days per year;
  • 7 wellness days per year (time off) that can be used to deal with household issues, to lie down and recover without taking sick leave;
  • Bonuses up to $5000 for recommending successful applicants for positions in the company;
  • 50% payment for professional training, international conferences and meetings;
  • Corporate discount for English lessons;
  • Health benefits. According to the paychecks, if you are not eligible for corporate medical insurance, the company will compensate you with up to $ 1,000 gross per year per employee. This can be spent on self-purchase of health insurance or on doctor’s fees for yourself and close relatives (spouse, children);
  • Workplace organization. The company provides all employees with an equipped workplace and all the necessary equipment (table, armchair, wifi, etc.) in our offices or co-working locations. In the other locations, the company provides reimbursement of workplace costs up to $ 1000 gross once every 3 years, according to the paychecks. This money can be spent on the rent of the co-working room, on equipping the working place at home (desk, chair, Internet, etc.) during those 3 years;
  • Internal gamified gratitude system: receive bonuses from colleagues and exchange them for merch, team building activities, massage certificates, etc.

    Social Discovery Group (SDG) — третья по величине компания в мире в сфере social discovery, объединяющая более 60 брендов и 500 миллионов пользователей.
    Мы решаем проблемы одиночества, изоляции и отсутствия связи, превращая виртуальную близость в новую норму.
    Наш портфель включает онлайн-платформы для общения, основанные на искусственном интеллекте, игровой механике и видеостриминге — такие как Dating.com, DateMyAge, Cupid Media, Dil Mil, Kiseki и другие.

    Мы ищем Руководителя команды IT-мониторинга (Head of IT Monitoring Team), который возглавит две команды — дежурных администраторов 24/7 (L1) и специалистов по техническому мониторингу (L2) — и будет отвечать за разработку, внедрение и эксплуатацию комплексной системы мониторинга, обеспечивающей стабильность, производительность и безопасность нашей IT-инфраструктуры и продуктов.

    Ваши основные задачи будут включать:

  • Обеспечивать стратегическое руководство, ставить цели команды в соответствии с целями компании и формировать дорожную карту развития возможностей мониторинга.

  • Развивать, эксплуатировать и совершенствовать стек мониторинга (Zabbix, Grafana, Prometheus и др.) с акцентом на поддержку микросервисной архитектуры и облачного мониторинга (AWS CloudWatch / Azure Monitor / Google Cloud Monitoring).

  • Гарантировать своевременное выявление и устранение инцидентов, повышать долю случаев, решаемых командой L1 без эскалации; выстраивать процессы на основе ITIL и управлять SLA.

  • Сотрудничать с IT- и продуктовыми командами для плавного вывода новых решений мониторинга в продакшн, поддерживать актуальную операционную документацию и runbook-и.

  • Требования:

  • Подтверждённый опыт руководства командами мониторинга/observability в компаниях с высоконагруженными веб-системами.

  • Глубокие знания протоколов, инструментов (Zabbix, Grafana, Prometheus), методологий и лучших практик мониторинга; опыт работы с мониторингом микросервисов.

  • Практический опыт применения RCA (root cause analysis) для критических инцидентов и облачного мониторинга (CloudWatch, Azure Monitor, Google Cloud Monitoring).

  • Отличные коммуникативные навыки и высокая ответственность; опыт построения команд, развития сотрудников и регулярной обратной связи; знание английского языка на уровне B2+.

  • Преимуществом будет: сертификация ITIL Foundation, знание AIOps и мониторинга с элементами ИИ, а также опыт full-stack разработки для создания внутренних инструментов, интеграций и дашбордов.

  • Что мы предлагаем:

  • Полностью удалённая работа (full-time).

  • 28 календарных дней отпуска в год.

  • 7 wellness-дней в год — можно использовать для решения бытовых дел или отдыха без оформления больничного.

  • Бонусы до $5000 за рекомендации успешных кандидатов.

  • 50% компенсации за профессиональное обучение, международные конференции и митапы.

  • Корпоративная скидка на занятия английским языком.

  • Медицинские льготы: если сотрудник не имеет корпоративной страховки, компания компенсирует до $1000 gross в год (на страховку или оплату медицинских услуг для себя и близких).

  • Организация рабочего места: компания предоставляет всё необходимое оборудование в офисах и коворкингах; для других локаций — компенсация расходов на рабочее место до $1000 gross раз в 3 года.

  • Внутренняя геймифицированная система благодарностей: можно получать бонусы от коллег и обменивать их на мерч, тимбилдинги, сертификаты на массаж и т.д.

  • Развивать команду: повышать квалификацию сотрудников, выстраивать прозрачную карьерную лестницу, готовить регулярные отчёты с операционными метриками и результатами команды.

Посмотреть контакты работодателя

Похожие вакансии

Alfaleads Group

Team lead of affiliates

Alfaleads Group

Удаленная работа
  • Сербия

  • Не указана

Рекомендуем

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию