ML / DS разработчик (Цифровой ассистент)

Описание вакансии

Наша команда создает нового ассистента в новой AI-first парадигме, перед нами стоит цель сделать сервисы экосистемы банка удобнее и доступнее.

Мы строим взаимодействие с пользователем, которое будет нативно встраиваться в агентную систему и строить интерфейс на лету.

Наша команда совершенствует подходы по работе с цифровыми ассистентами за счет использования собственной большой языковой модели - GigaChat и фреймворков по работе с ней.

Мы ищем сильного специалиста, которому интересно не только обучать модели, но и разбираться в устройстве пайплайнов, качестве данных, масштабировании запуска и воспроизводимости результатов. Для нас важны исследовательское мышление, аккуратность в экспериментах и готовность доводить идеи до практического результата.

Обязанности

разрабатывать и сопровождать пайплайны обучения генеративных моделей
готовить, проверять и дорабатывать датасеты для обучения, валидации и тестирования
запускать и оптимизировать distributed training на GPU-инфраструктуре
проводить эксперименты с новыми архитектурными подходами и режимами обучения
анализировать результаты экспериментов, формулировать выводы и доводить исследования до воспроизводимого состояния
изучать свежие статьи и проверять перспективные идеи на практике
участвовать в развитии инженерного контура обучения: окружение, запуск, мониторинг, стабильность, воспроизводимость

Требования

уверенное владение Python
опыт работы с PyTorch и Torch Lightning
опыт работы с Ray
опыт запуска обучения на CUDA
понимание того, как строятся и запускаются обучающие пайплайны
опыт работы с датасетами для ML-задач
понимание distributed training и практический опыт его использования
опыт работы в Linux-окружении
опыт использования Docker
опыт обучения генеративных моделей

Будет плюсом:

опыт работы с большими обучающими запусками и длительными экспериментами
понимание особенностей воспроизводимости ML-экспериментов
опыт профилирования и оптимизации обучения на GPU
опыт работы с пайплайнами подготовки данных
навык чтения и критического разбора research papers
интерес к новым архитектурам и нестандартным подходам в обучении моделей

Условия

гибридный формат работы (2-3 дня офис Кутузовская 32к1)
годовой бонус и ежегодный пересмотр
расширенный ДМС с первого дня + стоматология и льготное страхование для семьи
корпоративный университет Сбера, внутренняя образовательная платформа, участие в IT-конференциях
офис на Кутузовской с видом на набережную, зонами отдыха и спортзалом
90 дней удаленной работы из любого региона РФ (не применимо для сопровождения)
льготная ипотека в Сбере, корпоративная пенсионная программа, подписка СберПрайм+, скидки от партнеров и сервисов группы компаний.

Посмотреть контакты работодателя