Делаем весь ML на устройствах: Колонки, СберАвто и другие. Все E2E: от идеи, сбора данных, обучения моделей и ресерча, написания рантайма на C++ до выкатки в Prod и дальнейшего улучшения качества.
Обязанности
- Развитие платформы Giga Local для инференса ML моделей на различных устройствах
- Добавление новых фичей и архитектур моделей
- Добавление поддержки новых поверхностей: Android, IOS, Desktop, Web, Кастомное железо заказчиков
- Оптимизация инференса под конкретное железо: NPU / DSP / GPU / CPU
- Реализация Оффлайн Ассистента: LLM, RAG, MCP, мультимодальные модели
- Взаимодействие с ML командами для выбора ML архитектур под железо
Требования
- C++
- Python
- Представление как работает ML
Будет плюсом
- Опыт обучения ML моделей
- Знание современных ML архитектур
- Опыт с оптимизацией под NPU / DSP / GPU / Cuda / CPU
- Опыт разработки под Android / IOS / WebASM
- Олимпиадное прошлое
- Опыт в MLOps
Условия
- гибридный или удаленный формат работы
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 7%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров