Компания BSS — системно значимая российская ИТ-компания, специализирующаяся на разработке, внедрении и поддержке решений по цифровизации клиентского обслуживания для банков, финтех-компаний, госсектора, телекома, ритейла, медицины, сферы ЖКХ в России и СНГ. Мы разрабатываем системы речевой аналитики, развиваем платформы дистанционного банковского обслуживания, а также оказываем услуги по заказной и аутсорс разработке. Мы практикуем наиболее востребованные рынком технологические решения: от машинного обучения до разработки 1С.
Обязанности:
Основной фокус – Instruct tuning для задач Text-to-SQL / NL2SQL и PLP;
дизайн экспериментов, формулировка гипотез для улучшения NLP/PLP моделей и алгоритмов, планирование исследовательских экспериментов с выводами;
проведение экспериментов, написание кода, подготовка датасетов и бенчмарков, проведение замеров и анализ результатов;
обучение моделей на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей;
взаимодействие с прод-командой для интеграции моделей и алгоритмов в продакшн;
ориентированность на SOTA, читать пейперы, быть в курсе последних исследований, предлагать новые смелые подходы и направления.
Требования:
Хорошие теоретические знания в DL, с упором в современный NLP и трансформеры
Умение формулировать эксперименты с научной строгостью, обосновывать их, проводить самостоятельно и делать выводы
Опыт обучения трансформеров
Опыт распределенного обучения моделей (deepspeed, fsdp, torch.distributed, accelerate)
Знание стандартных библиотек для DL и NLP (PyTorch и библиотеки Huggingface)
Увлеченность NLP/PLP и DL
Знания lora/p-tune и других peft/sft-подходов
Знакомство с Spider/CoSQL
Опыт работы на похожей позиции
Участие в соревнованиях по ML
Сабмиты на лидербордах по NLP/PLP
Публикации уровня А/A*, Q1
Обучение моделей на кластере, опыт распределенного обучения
Условия:
Москва
до 310000 RUR