Наша команда создает нового ассистента в новой AI-first парадигме, перед нами стоит цель сделать сервисы экосистемы банка удобнее и доступнее.
Мы строим взаимодействие с пользователем, которое будет нативно встраиваться в агентную систему и строить интерфейс на лету.
Наша команда совершенствует подходы по работе с цифровыми ассистентами за счет использования собственной большой языковой модели - GigaChat и фреймворков по работе с ней.
Мы ищем сильного специалиста, которому интересно не только обучать модели, но и разбираться в устройстве пайплайнов, качестве данных, масштабировании запуска и воспроизводимости результатов. Для нас важны исследовательское мышление, аккуратность в экспериментах и готовность доводить идеи до практического результата.
Обязанности
- разрабатывать и сопровождать пайплайны обучения генеративных моделей
- готовить, проверять и дорабатывать датасеты для обучения, валидации и тестирования
- запускать и оптимизировать distributed training на GPU-инфраструктуре
- проводить эксперименты с новыми архитектурными подходами и режимами обучения
- анализировать результаты экспериментов, формулировать выводы и доводить исследования до воспроизводимого состояния
- изучать свежие статьи и проверять перспективные идеи на практике
- участвовать в развитии инженерного контура обучения: окружение, запуск, мониторинг, стабильность, воспроизводимость
Требования
- уверенное владение Python
- опыт работы с PyTorch и Torch Lightning
- опыт работы с Ray
- опыт запуска обучения на CUDA
- понимание того, как строятся и запускаются обучающие пайплайны
- опыт работы с датасетами для ML-задач
- понимание distributed training и практический опыт его использования
- опыт работы в Linux-окружении
- опыт использования Docker
- опыт обучения генеративных моделей
Будет плюсом:
- опыт работы с большими обучающими запусками и длительными экспериментами
- понимание особенностей воспроизводимости ML-экспериментов
- опыт профилирования и оптимизации обучения на GPU
- опыт работы с пайплайнами подготовки данных
- навык чтения и критического разбора research papers
- интерес к новым архитектурам и нестандартным подходам в обучении моделей
Условия
- гибридный формат работы (2-3 дня офис Кутузовская 32к1)
- годовой бонус и ежегодный пересмотр
- расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
- корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
- офис на Кутузовской с видом на набережную, зонами отдыха и спортзалом
- 90 дней удаленной работы из любого региона РФ (не применимо для сопровождения)
- льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.