Объединённая компания Wildberries и Russ — это международная технологическая компания, образованная в результате слияния двух лидеров рынка — IT-компании Wildberries и оператора наружной рекламы Russ.
Сейчас мы в поисках Старшего инженера по инфраструктуре ML.
Вам предстоит:
- Обеспечивать стабильную, производительную и масштабируемую аппаратную платформу для ML;
- Оперативно устранять сбои, поддерживать SLA, разрабатывать проактивные меры по предотвращению инцидентов;
- Выбирать и закупать оборудование, составлять ТЗ, (Техническое проектирование), тестировать и валидировать оборудование (Performance & Compatibility);
- Активно участвовать в проектах по ML, координировать работы смежных команд, взаимодействовать с поставщиками, подрядчиками и ЦОД;
- Администрировать кластеры GPU/TPU и распределенных вычислительных систем;
- Заниматься мониторингом и отслеживанием состояния инфраструктуры;
- Автоматизировать развертывания и обновления сервисов и рутинных операций;
- Заниматься оптимизацией затрат на вычислительные ресурсы;
- Заниматься поддержкой команды Data Science;
- Вести техническую документацию по архитектуре и процессам, разрабатывать стандарты, best practice, подготавливать отчеты по состоянию инфраструктуры.
Вы нам подходите, если имеете следующий опыт:
- Обеспечение стабильной, производительной и масштабируемой аппаратной платформы для ML;
- Оперативное устранение сбоев, поддержка SLA, разработка проактивных мер по предотвращению инцидентов;
- Выбор и закупка оборудования, составление ТЗ, (Техническое проектирование), тестирование и валидация оборудования (Performance & Compatibility);
- Активное участие в проектах по ML, координация работ смежных команд, взаимодействие с поставщиками, подрядчиками и ЦОД;
- Администрирование кластеров GPU/TPU и распределенных вычислительных систем;
- Мониторинг и отслеживание состояние инфраструктуры;
- Автоматизация развертывания и обновления сервисов и рутинных операций;
- Оптимизация затрат на вычислительные ресурсы;
- Поддержка команды Data Science;
- Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.
Будет плюсом:
- Оптимизация затрат на вычислительные ресурсы;
- Поддержка команды Data Science;
- Ведение технической документации по архитектуре и процессам, разработка стандартов, best practice, подготовка отчетов по состоянию инфраструктуры.
Условия для сотрудников:
- Обучение и развитие: языковые клубы, собственный корпоративный университет, программы развития управленческих навыков и многое другое;
- Благополучие сотрудников: корпоративный пакет ДМС со стоматологией, корпоративный спорт, консультации психолога и дополнительные возможности аккредитованной IT-компании;
- Множество сообществ: клуб спикеров, футбола, йоги, шахмат и т.д.;
- Забота о семьях: создаем условия, в которых легко сочетать карьеру и заботу о близких – от гибкого подхода до масштабных проектов для детей сотрудников;
- Скидки и партнерские программы: на обучение, страхование, покупки и многое другое;
- Комфортная рабочая среда: бесплатное питание в офисе, современные офисы рядом с метро, корпоративная техника и портал для сотрудников.