SMALL — крупная сеть супермаркетов Казахстана (150+ магазинов, собственные ЦОДы и облако).
Мы развиваем внутреннюю экосистему цифровых продуктов: e‑commerce‑платформу, BI‑аналитику, логистику 24×7. За кулисами всего этого — сотни серверов, виртуальных машин, баз данных и сервисов, которые должны работать без простоев. Укрепляем команду ИТ‑операций и ищем системного администратора уровня Middle/Senior в команду базовой инфраструктуры, который возьмёт на себя поддержку и развитие серверной инфраструктуры, автоматизацию рутинных задач и повышение надёжности.
Ваша миссия:
- Поддерживать стабильную работу серверов (Linux 70 % / Windows 30 %), сервисов AD/LDAP, файловых и печатных кластеров с целевой доступностью ≥ 99,95 %.
- Развивать виртуализацию (QEMU/KVM, Proxmox) и хранилища (FC/iSCSI/NFS + ZFS), обеспечивая масштабирование и отказоустойчивость.
- Настроить и поддерживать систему резервного копирования (Veeam/Bareos) с RPO ≤ 15 мин, регулярными DR‑тренировками.
- Автоматизировать типовые операции (Ansible, SaltStack, PowerShell, Bash/Python): создание VM, обновления, аудит конфигураций.
- Участвовать в построении собственного облака.
- Поддерживать мониторинг (Zabbix + Grafana, Elastic / Loki) и реагирование на инциденты по on‑call rota 1/4.
- Участвовать в построении и развитии собственных ЦОДов.
- Вести техническую документацию, проводить RCA/post‑mortem, обучать младших админов
Что важно:
- Опыт в Linux(Debian/Ubuntu, RHEL/CentOS) и Windows Server (AD, GPO, DFS, WSUS) не менее 3 лет.
- Уверенное администрирование гипервизоров KVM/Proxmox и/или VMware ESXi, базовое понимание Ceph/GlusterFS/ZFS.
- Хорошее знания железа, на уровне построения ЦОД (серверы, СХД, транспортный уровень).
- Знание сетевых служб: DHCP, DNS, NTP, VPN (IPsec/OpenVPN/WireGuard), firewall (ip tables, pfSense/MikroTik).
- Опыт работы с системами резервного копирования (Bareos/Bacula, Veeam, Restic, Borg) и DR‑планами
- Навыки автоматизации: Ansible (inventories, playbooks, roles), SaltStack, PowerShell для Windows‑задач, Bash/Python скрипты
- Мониторинг и логирование: Zabbix (item/trigger), Prometheus node‑exporter, Grafana, ELK/Loki; создание дашборд‑SLA
- Базовые знания баз данных: установка и обслуживание PostgreSQL/MySQL, MSSQL, Mongo, репликация и бэкапы
- Soft‑skills: приоритизация инцидентов, коммуникация с Dev/DevOps и службой безопасности, готовность к дежурствам
Условия работы
- Формат на выбор: офис (Алматы или Астана), гибрид или полностью удалённо;
- Свобода инструментов: предлагаем «best tool for the job», поддерживаем инициативы по внедрению новых решений
- Развитие: бюджет на сертификации (LFCS/LFCE, RHCSA/RHCE, VCP, MS AZ‑104), конференции, собственный lab‑кластер
- Непосредственное взаимодействие с командой DevOps, архитекторами и C‑level, влияние на стандарты и road‑map