Мы — команда, создающая инновационные решения на базе больших языковых моделей (LLM) для трансформации процессов работы с нормативной и правовой документацией в Сбере.
Наша цель — упростить и автоматизировать работу методологов, заменить рутинные задачи интеллектуальными инструментами и открыть новые возможности для анализа, генерации и поиска правовой информации.
Обязанности
- Разрабатывать и оптимизировать промпты для генерации, классификации и извлечения информации
- Проводить эксперименты с LLM и оценивать эффективность различных подходов
- Создавать пайплайны обработки документов: структурирование, сегментация, подготовка данных
- Применять NLP-модели (TF-IDF, CRF, BERT, T5) для анализа нормативной документации
- Работать с поисковыми системами (ElasticSearch, векторный поиск, ранжирование)
- Подготавливать API и сопровождать интеграцию решений в продакшн
Требования
- Высшее техническое/математическое образование
- Опыт работы на аналогичной позиции не менее 1 года
- Уверенные знания Python
- Уверенное знание теоретической базы ML (основные задачи и методы, метрики, типовые архитектуры моделей и т.д.) и NLP домена (токенизаторы, векторизаторы, transformers, BERT, LLM, RAG и т.д.)
- Опыт применения ML библиотек (pandas, numpy, matplotlib, scikit-learn, langchain или аналогичные библиотеки для работы с LLM)
- Опыт разработки RAG пайплайнов
- Опыт работы с документами разных форматов (docx, rtf, pdf и т.д.)
Условия
- Deep diving в предметную область, много разработки по задачам имеющим прямой эффект на бизнес
- Возможность привносить новые идеи и нестандартные решения
- Сообщество D-people– поддержка, развитие и возможность учиться у профессионалов
- Достойную оплату труда
- ДМС, сниженные ставки по кредитованию, программы лояльности для сотрудников
- Современный офис рядом с метро Кутузовская, бесплатный фитнес в офисе