SberDevices — инновационное направление экосистемы Сбера, которое создает умные устройства, виртуальных ассистентов и платформенные решения в области NLP, computer vision, speech и ML-инфраструктуры.
Команда ML HomeOS ищет ML Engineer, который будет заниматься обучением и адаптацией языковых моделей для пользовательских сценариев умных устройств: голосовой ассистент, управление HomeOS, персонализация и контекстное понимание, с фокусом на продакшен-качество и масштабирование.
Чем ты будешь заниматься:
- обучение и дообучение языковых моделей: continued pretraining / domain-adaptive pretraining под задачи HomeOS
- проведение Supervised Fine-Tuning (SFT) для decoder-only LLM, обучение и адаптация encoder-моделей под прикладные сценарии
- применение и развитие parameter-efficient fine-tuning подходов: LoRA / adapters / prefix- и prompt-tuning
- обучение и адаптация BERT-подобных encoder-моделей, а также классификаторов и encoder / seq2seq моделей для NLP-задач
- составление требований для датасетов SFT
- построение и поддержка пайплайнов обучения и переобучения моделей
- оптимизация моделей под продакшен-ограничения (latency, память, масштабирование)
- взаимодействие с инфраструктурными командами при интеграции моделей в ML-платформу HomeOS.
Мы ожидаем:
- опыт работы в ML / NLP от 3 лет
- практический опыт fine-tuning трансформеров
- опыт работы с LoRA / adapters / PEFT-подходами
- понимание архитектур ecoder-only, decoder-only, encoder-decoder)
- опыт обучения классификаторов и encoder / seq2seq моделей
- понимание ML-продакшена: воспроизводимость, версионирование, стабильность и воспроизводимость инференса
- опыт оптимизации обучения и инференса моделей
- навыки построения ML-пайплайнов и работы с оркестраторами.
Будет плюсом:
- опыт участия в pretraining или large-scale fine-tuning проектах
- понимание особенностей продакшен-эксплуатации LLM
- опыт domain adaptation (continued pretraining, SFT, data-centric подходы) под закрытые или специфичные домены
- опыт распределённого обучения и оптимизации инференса
- опыт работы с ML-инфраструктурой для high-load систем
- опыт работы с:
- RLHF / preference optimization
- Distillation / quantization
- Inference optimization (KV-cache, batching и др.)
Условия
- гибридный формат работы (м Новослободская)
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- регулярные митапы и развитое DS-community
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбер.