Москва, улица Кулакова, 20к1
Метро: МякининоТехВилл – IT-компания и партнёр ВкусВилл по развитию цифровых решений.
Мы отвечаем за разработку мобильных и web- приложений, автоматизацию бизнес-процессов, искусственный интеллект, devops, инфобез ВкусВилла.
Нашими решениями пользуется свыше 1 000 000 клиентов и сотрудников ВкусВилла.
Наша команда в поиске ключевого специалиста, отвечающего за проектирование, развертывание и оптимизацию высокопроизводительной вычислительной AI инфраструктуры.
Обязанности:
проектирование и архитектура масштабируемых AI-кластеров для распределенного обучения и инференса моделей глубокого обучения;
разработка технического дизайна размещения кластеров в дата-центрах (ЦОД): планирование стоек, энергопотребления, охлаждения, сетевой инфраструктуры;
выбор и оптимизация интерконнекта между GPU-узлами для минимизации задержек и максимизации пропускной способности;
определение требований к аппаратному обеспечению (серверы, GPU, системы хранения данных, сетевые коммутаторы);
разработка стратегий масштабирования инфраструктуры с учетом роста вычислительных потребностей и новых технологий;
создание и поддержание документации по архитектуре, стандартам и процедурам развертывания.
Требования:
опыт работы от 4 лет в проектировании и построении высоконагруженной, отказоустойчивой ИТ-инфраструктуры;
глубокие практические знания в области аппаратного обеспечения для AI/ML: архитектуры GPU (NVIDIA), специализированные ускорители, серверные платформы;
опыт выбора, настройки и оптимизации высокоскоростных сетевых технологий для HPC/AI (InfiniBand, ROCE, Ethernet) на уровне архитектуры;
понимание принципов работы дата-центров: проектирование под мощность, охлаждение, размещение оборудования;
знание программного стека для управления кластерами (Kubernetes, Slurm, аналоги) и систем хранения для больших данных;
понимание жизненного цикла ML-моделей и их требований к инфраструктуре на разных этапах;
инструментальное владение AI для анализа, генерации и автоматизации.
БЮРО 1440
Москва
Не указана