Команда занимается развитием памяти для GigaChat. Мы разрабатываем механизмы глобальной памяти, которые способны сохранять важную информацию о пользователях и обеспечивать эффективный доступ к ней независимо от текущего сеанса общения.
Наша цель — повысить качество коммуникации и персонализацию общения с LLM.
Обязанности
- строить NLP-пайплайны и оценивать их
- дообучать языковые модели (BERT, GPT like) на разных доменах данных
- деплоить разработанные модели в сервисы, собирать библиотеки
- поддерживать модели в будущем, дорабатывать при необходимости
Требования
- опыт с моделями и библиотеками: embedders, langchain/LlamaIndex (будет плюсом), FAISS/HNSW и тп.
- опыт работы с prompt engineering и fine-tuning LLM с peft (lora/ptuning)
- опыт работы с локальными моделями LLM (llama.cpp, vllm и тп.) как плюс.
- базовые знания, понимание архитектур и опыт работы с моделями, такими как BERT-like, llama-like/GPT
- знания python и библиотек для машинного обучения и nlp (pytorch, transformers, sklearn, spacy, nltk и тп.)
- высшее образование в области компьютерных наук, математики или смежных дисциплин (выпускной курс бакалавриата или магистратура 1-2 курс)
Как минимум, все ниже указанное в рамках пет-проектов соревнований или лабораторных работ.
Условия
- возможность выбрать удобный график – офис или гибрид (локация: м. Кутузовская)
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.