Старший инженер по инфраструктуре ML

WILDBERRIES

Старший инженер по инфраструктуре ML

Москва, улица Большая Ордынка, 40с4

Метро: Октябрьская

Описание вакансии

Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ.
Сейчас мы в поисках Старшего инженера по инфраструктуре ML.


Вам предстоит:

  • Обеспечивать стабильную, производительную и масштабируемую аппаратную платформу для ML;
  • Оперативно устранять сбои, поддерживать SLA, разрабатывать проактивные меры по предотвращению инцидентов;
  • Выбирать и закупать оборудование, составлять ТЗ, (Техническое проектирование), тестировать и валидировать оборудование (Performance & Compatibility);
  • Активно участвовать в проектах по ML, координировать работы смежных команд, взаимодействовать с поставщиками, подрядчиками и ЦОД;
  • Администрировать кластеры GPU/TPU и распределенных вычислительных систем;
  • Заниматься мониторингом и отслеживанием состояния инфраструктуры;
  • Автоматизировать развертывания и обновления сервисов и рутинных операций;
  • Заниматься оптимизацией затрат на вычислительные ресурсы;
  • Заниматься поддержкой команды Data Science;
  • Вести техническую документацию по архитектуре и процессам, разрабатывать стандарты, best practice, подготавливать отчеты по состоянию инфраструктуры.

Вы нам подходите, если имеете следующий опыт:

  • Обеспечение стабильной, производительной и масштабируемой аппаратной платформы для ML;
  • Оперативное устранение сбоев, поддержка SLA, разработка проактивных мер по предотвращению инцидентов;
  • Выбор и закупка оборудования, составление ТЗ, (Техническое проектирование), тестирование и валидация оборудования (Performance & Compatibility);
  • Активное участие в проектах по ML, координация работ смежных команд, взаимодействие с поставщиками, подрядчиками и ЦОД;
  • Администрирование кластеров GPU/TPU и распределенных вычислительных систем;
  • Мониторинг и отслеживание состояние инфраструктуры;
  • Автоматизация развертывания и обновления сервисов и рутинных операций;
  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Будет плюсом:

  • Оптимизация затрат на вычислительные ресурсы;
  • Поддержка команды Data Science;
  • Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.

Условия для сотрудников:

  • Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
  • Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
  • Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
  • Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
  • Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
  • Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию