Аскона — крупная федеральная компания с более чем 35-летней историей. Мы производим и продаём мебель, товары для дома и уюта по России и странам СНГ. Сильный бренд, собственное производство, выстроенные бизнес-процессы и понятные стандарты работы обеспечивают стабильность и прогнозируемый результат.
Управлять процессом Incident Management end‑to‑end: классификация, приоритизация, маршрутизация инцидентов, контроль соблюдения SLA
Координировать решение Blocker/Critical‑инцидентов (организация War Room, эскалация при нарушении SLA)
Проводить Post‑Mortem для Blocker/Critical‑инцидентов в течение 48 часов после закрытия
Обеспечивать первичную диагностику инцидентов на уровне L2 и решать типовые инциденты (config changes, перезапуск сервисов, workarounds)
Создавать и поддерживать актуальные Runbooks и базу знаний по типовым инцидентам и их решениям
Готовить отчётность: еженедельные отчёты по инцидентам для CTO и Team Leads, ежемесячные обзоры с анализом трендов для CTO и CPO, квартальный анализ трендов
Руководить командой Support L2 (1–2 специалиста): организовывать on‑call‑ротацию, обучать и развивать сотрудников, проводить 1:1 и performance review, участвовать в найме
Отслеживать ключевые метрики (MTTR, SLA compliance, reopen rate), выявлять системные проблемы и предлагать preventive actions
Общий опыт: не менее 5 лет в IT, из них — не менее 3 лет в support / SRE / DevOps / production operations
Управленческий опыт: не менее 1 года руководства командой; опыт работы с ITIL / Incident Management (обязательно), в e‑commerce (желательно)
Операционные навыки: уверенное владение инструментами мониторинга (Grafana, Zabbix, Prometheus) и логирования (ELK, Loki, Kibana), умение настраивать алерты и анализировать логи
Технические компетенции: базовые навыки работы с SQL (запросы для диагностики), Docker и Kubernetes (просмотр pods/logs, понимание контейнеризации), а также понимание принципов CI/CD (pipeline, rollback, canary deploy) и REST API (работа с HTTP, тестирование через curl/Postman)
Знание ITIL v4: глубокое понимание и практический опыт внедрения процессов Incident Management
Будет преимуществом: опыт внедрения Incident Management с нуля, знание SRE‑практик (SLI/SLO/SLA, error budgets), языков программирования (Go/Python/JavaScript на уровне чтения кода), а также опыт настройки систем обзвона