ML Engineer (ML HomeOS)

Описание вакансии

SberDevices — инновационное направление экосистемы Сбера, которое создает умные устройства, виртуальных ассистентов и платформенные решения в области NLP, computer vision, speech и ML-инфраструктуры.

Команда ML HomeOS ищет ML Engineer, который будет заниматься обучением и адаптацией языковых моделей для пользовательских сценариев умных устройств: голосовой ассистент, управление HomeOS, персонализация и контекстное понимание, с фокусом на продакшен-качество и масштабирование.

Чем ты будешь заниматься:

обучение и дообучение языковых моделей: continued pretraining / domain-adaptive pretraining под задачи HomeOS
проведение Supervised Fine-Tuning (SFT) для decoder-only LLM, обучение и адаптация encoder-моделей под прикладные сценарии
применение и развитие parameter-efficient fine-tuning подходов: LoRA / adapters / prefix- и prompt-tuning
обучение и адаптация BERT-подобных encoder-моделей, а также классификаторов и encoder / seq2seq моделей для NLP-задач
составление требований для датасетов SFT
построение и поддержка пайплайнов обучения и переобучения моделей
оптимизация моделей под продакшен-ограничения (latency, память, масштабирование)
взаимодействие с инфраструктурными командами при интеграции моделей в ML-платформу HomeOS.

Мы ожидаем:

опыт работы в ML / NLP от 3 лет
практический опыт fine-tuning трансформеров
опыт работы с LoRA / adapters / PEFT-подходами
понимание архитектур ecoder-only, decoder-only, encoder-decoder)
опыт обучения классификаторов и encoder / seq2seq моделей
понимание ML-продакшена: воспроизводимость, версионирование, стабильность и воспроизводимость инференса
опыт оптимизации обучения и инференса моделей
навыки построения ML-пайплайнов и работы с оркестраторами.

Будет плюсом:

опыт участия в pretraining или large-scale fine-tuning проектах
понимание особенностей продакшен-эксплуатации LLM
опыт domain adaptation (continued pretraining, SFT, data-centric подходы) под закрытые или специфичные домены
опыт распределённого обучения и оптимизации инференса
опыт работы с ML-инфраструктурой для high-load систем
опыт работы с:
RLHF / preference optimization
Distillation / quantization
Inference optimization (KV-cache, batching и др.)

Условия

гибридный формат работы (м Новослободская)
годовая премия
корпоративный спортзал и зоны отдыха
более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
регулярные митапы и развитое DS-community
расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
вознаграждение за рекомендацию друзей в команду Сбер.