Центр Исследований занимается созданием SoTA технологий искусственного интеллекта для анализа финансовых данных и их применения для AI-трансформации Блока Риски. Наша задача разработать и обучить мультимодальную reasoning модель, объединяющей текстовые данные и цифровые следы клиентов для улучшения качества решений банковских задач.
Обязанности
- проводить генерацию и очистку синтетических данных с использованием LLM и LLM-as-a-Judge подходов
- обучать большую мультимодальную LLM (текст + цифровые следы клиентов)
- применять RL подходы для улучшения reasoning способностей модели
- выполнять валидацию на современных бенчмарках разработанного решения с точки зрения точности и корректности рассуждений
- оценивать решения на real-world данных
Железо и данные:
- выделенный кластер 500+ GPU A100 80GB
- Spark/Hadoop для работы с Big Data
- доступ ко всем банковским данным, необходимым для построения решения.
Требования
- глубокие знания ML/DL (в частности, трансформеры, большие
языковые модели)
- опыт обучения LLM моделей
- уверенные знания Python: torch, transformers, peft
- Английский B2+
Будет плюсом:
- опыт работы с мультимодальными моделями
- знание методов RL для LLM (RLHF, DPO, GRPO, RLVR, GSPO)
- опыт распределенного обучения больших моделей (FSDP, ZeRO, Mixed-precision, Tensor/Pipeline Parallelism)
- публикации в топовых журналах (Q1) или конференциях (A-A*).
Условия
- офисный формат работы (локация: возле м. Кутузовская)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.