Команда RnD NLP занимается исследованиями на переднем краю LLM-строения; в зоне интересов как улучшение рецептов обучения LLM (pretrain, SFT, RL), так и разведка новых технологических компонент (reasoning, agents, специализированные модели, etc.)
Мы стремимся доводить результаты исследований до прикладного применения и сделать флагманскую модель GigaChat умнее, лучше и полезнее.
Обязанности
- работа с большими языковыми моделями, разбор имеющихся пайплайнов по кирпичикам, поиск направлений, где можно сделать diff +1-10%, генерация исследовательских гипотез, где можно сделать diff x2-x10
- обучение, валидация и имплементация новых state-of-the-art подходов для соответствующих задач
- упаковка исследований и презентация результатов, delivery до прод GigaChat
- публикация результатов исследований в топовых научных конференциях (опционально).
Требования
- опыт в современном трансформерном NLP, отличное теоретическое понимание этапов разработки топовых индустриальных LLM, практический опыт (включая pet-проекты) хотя бы в одном релевантном этапе
- хорошая насмотренность по научным и индустриальным статьям, понимание, в какую сторону развивается отрасль, какие направления исследований самые «горячие», какими методами/моделями/датасетами достигаются те или иные результаты, какими бенчмарками это валидируется и т.п.
Будет плюсом:
- большой опыт в классическом ML/NLP
- публикации уровня А/А* и опыт написания статей
- призовые места в соревнованиях по машинному обучению (Kaggle, etc.).
Условия
- комфортный современный офис рядом с м. Кутузовская
- возможность выбрать удобный график – офис/гибрид/удаленка (РФ)
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников по дисконтной прогамме
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.