Динамично растущая команда, разрабатывающая средства оптимизации исполнения математических моделей искусственного интеллекта для всей экосистемы Сбера.
Обязанности
- проведение анализа производительности различных нейронных сетей на различных ускорителях
- подготовка и настройка тестовых стендов
- запуск выбранных нейронных сетей
- оптимизация параметров запуска в зависимости от конфигураций тестового стенда
- снятие результатов тестов производительности
- обработка и анализ результатов тестов производительности
- поиск причин возможных отклонений полученных результатов от ожидаемых значений
- запуск различных тестов производительности нейронных сетей
- анализ появления новых нейронных сетей
- выводы о технических возможностях запуска новых нейронных сетей на различных ускорителях
- обеспечение стабильного и корректного исполнения работы нейронных сетей на имеющемся оборудовании.
Требования
- знание основных базовых архитектур нейросетей и метрик качества в одной или нескольких областях: CV, NLP, Audio, Rec systems
- опыт работы с ONNX, Pytorch, TensorFlow
- знания Git и Docker на пользовательском уровне
- уверенное знание Python
- Linux на уровне пользователя
будет плюсом:
- опыт практического применения OpenVINO, TensorRT, TVM
- опыт разработки на C++
- опыт написания пользовательских слоев для фреймворков.
Условия
- комфортный современный офис на Тургенева, 30 (бывший офис Интела), гибридный график работы
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.