Дата-центры — это основа функционирования любой современной IT-компании. Они обеспечивают надёжную работу сервисов, хранение и обработку огромных объёмов данных, поддерживают непрерывность бизнес-процессов. Без эффективных дата-центров невозможно представить работу облачных платформ, онлайн-сервисов, систем машинного обучения и других высокотехнологичных решений.
Мы разрабатываем DCIM — основу современного автоматизированного дата-центра. Наша платформа объединяет управление устройствами, учёт IT-активов, планирование мощностей и мониторинг. Она является критически важной инфраструктурой для работы всех сервисов Яндекса — от облачных гиперскейлеров до финансовых систем и AI/ML-платформ.
Чем предстоит заниматься:
- Предстоит проектировать и совершенствовать модели данных, которые описывают тысячи единиц оборудования с их сложными взаимосвязями. Это основа для принятия стратегических решений по развитию парка.
- Разрабатывать алгоритмы для оценки и прогнозирования потребления критических ресурсов дата-центров: электропитание, охлаждение, физическое пространство. Ваши решения помогут оптимально планировать развитие инфраструктуры на годы вперёд.
- Вы будете развивать системы, которые «по кнопке» настраивают firmware серверов, устанавливают ОС, проводят нагрузочное тестирование и мониторинг состояния оборудования.
Мы ожидаем, что Вы:
- Уверенно владеете Python и занимались бэкенд- разработкой на нём больше 5 лет
- Работали с реляционными и нереляционными СУБД
- Готовы нести ответственность за продукт в целом, а не только за код
- Имеете опыт работы с CI/CD, контейнерами и системами виртуализации
- Обладаете системным мышлением и умеете работать со сложными доменными областями
Будет плюсом:
- Глубокое понимание сетевых технологий (в т.ч. различий между IPv4 и IPv6 и других ключевых аспектов);
- Знание архитектуры и принципов работы ядра Linux;
- Интерес к инфраструктурным задачам и аппаратному обеспечению (hardware);
- Опыт работы с большими объёмами данных, включая их обработку и структурирование.