МГТС — основной телекоммуникационный партнер города Москвы и часть экосистемы МТС. Проектируем, строим и эксплуатируем передовую телекоммуникационную инфраструктуру, развиваем и внедряем сети нового поколения, реализуем комплексные решения для Умного города.
Мы ищем DevOps-инженера.
Предстоит отвечать за инфраструктуру дата-платформы как за продукт: хранилище, оркестрацию, надёжность, безопасность и self-serve для команд данных. Это не роль «админа Kubernetes» и не «дата-инженера» в чистом виде — нам нужен инженер с DevOps-руками и системным DataOps-мышлением.
Сейчас у нас в работе действующее хранилище на MSSQL и lakehouse, который дошёл до MVP. Ближайшая большая задача — подготовить хранилище и вывести lakehouse-MVP в прод на Kubernetes, а вокруг него выстроить нормальную эксплуатацию: релизный цикл, мониторинг, бэкапы, ролевую модель. Параллельно — мигрировать источники и интерфейсы с действующего хранилища на новое.
Чем предстоит заниматься:
Принять и стабилизировать
- разобраться в действующем хранилище: серверы, источники, интерфейсы текущего MSSQL;
- разобраться в текущей инфраструктуре дата-платформы: S3-хранилище, оркестрация, мониторинг;
- настроить и проверить бэкапы и восстановление — DR прогнать по-настоящему, а не на бумаге;
- закрыть пробелы в алертинге и зафиксировать ключевые решения в ADR (часть контекста не задокументирована).
Релизный цикл и эксплуатация
- настроить GitFlow и DataOps-workflow: контракты, тесты, CI/CD;
- войти в релизный цикл: раскладка на прод, откаты, контроль выкаток;
- оркестрация: часть сервисов интегрировать, часть развернуть и подключить; настроить DAG-и для поддержания здоровья платформы (health-checks, регламентные проверки);
- развернуть и донастроить мониторинг (Grafana, Prometheus), завести метрики здоровья платформы.
Безопасность и доступ
- управлять сертификатами (TLS/PKI): выпуск, ротация, контроль сроков;
- ролевая модель через AD с ограничением прав на уровне инфраструктуры;
- разграничивать доступ на уровне БД и каталога: важно, чтобы права, заданные в данных, доезжали до конечных интерфейсов — API, событий, SQL, — а не терялись по дороге.
Вывод lakehouse-MVP в прод
- манифесты, шаблоны развёртывания, квоты для sandbox и прода, lifecycle-политики хранилища;
- self-serve: быстрый и предсказуемый онбординг новых продуктов данных;
- участвовать в планировании инфраструктурной составляющей новых проектов (миграция, масштабирование).
Что мы ждем от кандидата:
- Kubernetes в проде: эксплуатация и умение довести сервис от рабочего состояния до устойчивого прод-развёртывания; переиспользуемые манифесты;
- S3-совместимое хранилище (MinIO / Ceph RGW): развёртывание, мониторинг здоровья, расширение ёмкости, квоты, lifecycle;
- бэкапы и восстановление: настройка, регламент, проверенный на практике DR;
- CI/CD, GitFlow и DataOps-workflow, участие в релизном цикле и раскладке на прод;
- оркестрация: развёртывание и интеграция сервисов, DAG-и поддержки здоровья;
- IaC на Ansible (основной инструмент) и скриптинг на Python;
- мониторинг и алертинг: Loki, Grafana, Prometheus; SLA/SLO и метрики здоровья;
- готовность работать в регулируемом контуре под требования ФСТЭК: сертификаты (TLS/PKI), интеграция с AD, ролевая модель с ограничением прав;
- понимание того, как роли и ограничения на уровне БД должны передаваться в интерфейсы — API, события, SQL.
Будет плюсом
- опыт вывода lakehouse в прод и понимание data mesh — у нас MVP уже есть, дальше масштабируем вместе с командой;
- разграничение доступа к данным: RLS / CLS на уровне Iceberg или каталога;
- зрелый взгляд на продукты данных как атомарные единицы: онбординг, шаблоны, принципы self-serve;
- Incident / event management, API-интеграции с корпоративными сервисами;
- Go в дополнение к Python;
- боевой опыт прохождения ФСТЭК, а не только готовность.
Мы предлагаем:
- гибридный/удалённый формат работы;
- отсутствие жесткого дресс-кода и гибкое начало рабочего дня 8:00-10:00, восьмичасовой рабочий день;
- участие в профессиональных встречах клуба AI;
- работу в современной надёжной цифровой компании;
- Agile-культуру: продуктовые команды, Scrum и Kanban, демо-дни, внутренние митапы;
- полезные курсы и вебинары в корпоративном университете и электронные библиотеки, программы развития;
- медицинскую страховку с 1 месяца со 100% покрытием расходов, включая стоматологию, страхование жизни и здоровья в поездках за рубеж. А еще можно застраховать родственников с корпоративной скидкой;
- спортзал и массажный кабинет в офисе;
- единую подписку МТС Premium — онлайн-кинотеатр KION, сервис МТС Music;
- скидки и предложения от партнеров на фитнес, занятия английским и прочее.
#DevOps #dwh #Kubernetes #MSSQL #CI/CD #Python