Наша команда отвечает за качество моделей TTS в SaluteSpeech – той части SberDevices, которая занимается звуком. Наш синтез можно услышать у ассистентов Салют, в колл-центре по номеру 900, в Сболе. Сейчас мы ищем ребят, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.
Как у нас все устроено:
- команда живет в 4 городах, общаемся текстом и по видео
- работать можно в удобное время, обязательных созвонов 1-3 в неделю
- очень много данных и карточек для обучения
- работа обычно происходит так: формулируем гипотезу, улучшаем модель, обгоняем прод по метрикам, показываем команде runtime, помогаем им затащить в прод
- чаще всего успешные модели – это улучшенные старые, в итоге развиваем свой звездолет
Вся работа с разметкой для обучения и подсчет метрик уже автоматизированы, очень удобно. Можно прийти на нашу студию, поговорить в микрофон 3 часа и обучить свой синтез.
Обязанности
- улучшать модели
- обгонять прод по метрикам
- помогать внедрять
- фантазировать, экспериментировать, читать статьи
- заниматься проектами, например ускорение обучения, voice cloning, low resource, rl
- рассказывать о решении задач на внутренних семинарах, а также на хабре и в нашем чатике в тг.
Требования
- python, алгоритмы, математика
- знания в DL, особенно про звук
- опыт обучения моделей для прода
- кругозор (nlp, лингвистика, русский язык, биология, физика -- что имеет отношение к речи)
- c++
- публикации
Условия
- гибридный или удаленный формат работы (РФ)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития расширенный
- ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.