Мы развиваем современные нейросетевые подходы для обработки огромного количества данных. Наша цель — разработать мощную базовую модель, которая станет ядром для множества продуктов и решений компании. Мы работаем на стыке различных направлений, таких как RecSys, NLP, TimeSeries, tabular DL и другие. Перед нами стоит множество задач по исследованию новых и адаптации текущих подходов из индустрии.
Обязанности
- Разрабатывать и обучать модели в распределённом режиме
- Изучать современные исследования и передовые подходы в области глубокого обучения
- Исследовать новые подходы для разных этапов обучения: pretraining и адаптации модели под конкретные задачи
- Исследовать multi-task подходы
- Работать с огромным количеством данных, в том числе с текстами
- Пилотировать модели, тестировать их в продакшн-среде и влиять на ключевые бизнес-решения
- Оптимизировать инфраструктуру для обучения и инференса больших моделей
- Погружаться в бизнес-задачи и быстро интегрировать решения.
Требования
- Опыт в DL
- Отличное понимание архитектуры трансформеров, RNN и тонкости их обучения
- Умение писать эффективный код на Python и PyTorch
- Понимание основ распределенного обучения.
Будет плюсом:
- Опыт работы с распределённым обучением (DDP, DeepSpeed, FSDP)
- Участие и победы в соревнованиях на kaggle и хакатонах
- Наличие pet-проектов по DL
- Навыки работы со spark.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Формат работы - офис, 40 часов
- Очное обучение на 4 курсе бакалавриата или 1-2 курсе магистратуры
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития.