Инженер платформы

Инженер платформы

Описание вакансии

Провайдер современных облачных сервисов (14 лет на рынке),
имеющий ИТ-аккредитацию,
предоставляющая услуги аренды вычислительных мощностей и платформенных сервисов для разработчиков приглашает в команду Инженера платформы (SRE).

Развиваем PaaS-платформу на базе open-source CozyStack.
Это self-hosted облако: bare-metal серверы → Talos Linux → Kubernetes, поверх через Cluster API и KubeVirt поднимаются гостевые Kubernetes-кластеры и виртуальные машины. Persistent storage — LINSTOR/DRBD, GitOps — FluxCD, managed-сервисы (PostgreSQL, Kafka, Redis и др.) — через операторы.

Задачи на уровне «ниже managed приложений пользователей в тенант неймспейсах»: Kubernetes и его экосистема, виртуализация, распределённый storage, сеть Linux, GitOps.

Стек: Kubernetes, KubeVirt, Cluster API, Talos Linux, FluxCD, Helm, LINSTOR/DRBD, Cilium/KubeOVN

Чем предстоит заниматься:
  • Разбирать инциденты в production как третья линия поддержки, где причина часто лежит на стыке компонентов (Kubernetes - CAPI - KubeVirt - Linstor)

  • Оформлять находки в виде внутренних статей, issue в upstream-проекты.

  • Конфигурировать компоненты платформы. Пример реальной задачи: изучить документацию CozyStack по VM golden image, подготовить image, настроить package CR для публикации подготовленного шаблона пользователям платформы, описать нюансы в runbook.

  • Эксплуатировать платформу: обновления, тюнинг платформенных манифестов, кастоимзация дашбордов grafana, alertrmanager, vmrules итп.

  • Деплой новых узлов платформы на baremetal, эскалация инцидентов с физикой в другие команды

Что важно уметь:

Kubernetes на уровне понимания, а не kubectl:

  • Admission controllers, ResourceQuota, LimitRange, RBAC, NetworkPolicy.

  • CRD, controller, reconciliation loop, финалайзеры, owner references — уметь разобраться с зависшим объектом и прочитать логи оператора.

  • Жизненный цикл Pod’а, eviction, QoS, ephemeral vs persistent storage.

Linux и сеть — ниже Kubernetes:

  • TCP/IP - на уровне маршрутов и подсетей, понимание чем хостовая сеть отличается от сервисной

  • Общее понимание BGP и что такое MetalLB

GitOps и Helm:

  • Умение читать чужие Helm-чарты

  • Опыт с FluxCD или ArgoCD: reconciliation, откат релизов, диагностика failed- состояний.

  • Git: rebase, cherry-pick, diff — для поиска регрессий и багов в upstream.

Поиск и отладка — главный навык:

  • Формулировать и проверять гипотезы, а не угадывать.

  • Спускаться по уровням: симптом → Kubernetes-объект → контроллер → CR →

  • Pod → процесс

  • Отличать корневую причину от следствия.

  • Писать читаемые runbook и GitHub issue.

Понимание managed-сервисов на уровне пользователя:

  • Знаете зачем нужны реплики, HA, failover и rolling update.

  • Понимаете основные параметры этих сервисов: primary/replica, min/max replicas, storageClass.

Soft skills:

  • Самостоятельность в задачах уровня «разберись с X начиная с readme.md в github»

  • Рабочий английский на письме и чтении (github)

Будет плюсом:
  • Опыт с KubeVirt, Cluster API, Kamaji или другими управляемыми control-plane.

  • Опыт с распределёнными блочными storage: LINSTOR/DRBD, Ceph/Rook, Longhorn, OpenEBS.

  • Опыт с Talos Linux или другими дистрибутивами для Kubernetes.

  • Отладка CNI: Cilium, KubeOVN

  • Понимание sysctl сетевого стека (keepalive, buffer sizes)

  • Опыт с операторами баз данных (CloudNativePG, Strimzi, MariaDB Operator).

  • Open-source контрибуция в проекты CNCF-экосистемы.

  • Observability: VictoriaMetrics, Grafana, AlertManager.

  • Хоть раз сами деплоили и использовали managed: PostgreSQL, Redis, Kafka или аналоги — знаете как подключиться, как проверить что данные пишутся и failover прошёл корректно.


Условия:
  • удаленная работа,
  • белая зарплата, выплачивается в срок вне зависимости от локдаунов и других форс-мажоров,
  • оформление по ТК,
  • дружный коллектив,
  • ИТ-отсрочка от армии,
  • возможность профессионального роста.
Навыки
  • Kubernetes
  • KubeVirt
Посмотреть контакты работодателя

Похожие вакансии

TravelLine
  • Санкт-Петербург

  • Не указана

Рекомендуем
AVA Team
  • Санкт-Петербург

  • Не указана

Рекомендуем
АйТи Авиа

DevOps-инженер

АйТи Авиа

  • Санкт-Петербург

  • Не указана

Рекомендуем
КСОР
  • Санкт-Петербург

  • Не указана

ЕДИНЫЙ ЦУПИС

DevSecOps/AppSec - инженер

ЕДИНЫЙ ЦУПИС

  • Санкт-Петербург

  • Не указана

Кельник Студиос

DevOps / Platform Engineer

Кельник Студиос

  • Санкт-Петербург

  • до 220000 RUR

ЕДИНЫЙ ЦУПИС

DevSecOps/AppSec - инженер

ЕДИНЫЙ ЦУПИС

  • Москва

  • до 220000 RUR

  • Санкт-Петербург

  • до 220000 RUR

VK
  • Санкт-Петербург

  • до 220000 RUR

Таймвэб.Клауд
  • Санкт-Петербург

  • до 155000 RUR

Live Typing
  • Санкт-Петербург

  • до 310000 RUR

ИдаПроджект

DevOps-инженер

ИдаПроджект

  • Санкт-Петербург

  • до 310000 RUR

Детский центр Шамиля Ахмадуллина

Промт-инженер (Prompt Engineer) LLM инженер / AI инженер

Детский центр Шамиля Ахмадуллина

  • Санкт-Петербург

  • до 310000 RUR

ITACWT
  • Санкт-Петербург

  • до 310000 RUR

Сервер Молл

Сетевой инженер

Сервер Молл

  • Санкт-Петербург

  • до 310000 RUR

Nord.Codes
  • Санкт-Петербург

  • до 350000 RUR

Кобак Лаб
  • Санкт-Петербург

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию