Мы — GigaChat Alignment. Делаем модель полезной и надёжной: SFT/DPO, дистилляция в маленькие модели, LoRA-сервис, метрики и валидирующие пайплайны. Быстро проверяем гипотезы, ускоряем обучение и выкатываем улучшения в прод — сначала для внутренних клиентов, потом для всей России.
Направления:
улучшение SFT / DPO: тестирование новый подходов к обучению, ускорение пайплайнов, генерация новых данных, дистиляция знаний из больших LLM в маленькие.
Развитие метрик качества GigaChat-а, например, через оценку способности решать задачи олимпиад международного уровня. Развитие внутреннего LLM-AS-A-JUDGE.
Разработка сервиса Lora обучения GigaChat и GigaEmbeder. Повышение стабильности и воспроизводимости запусков, создание пайплайнов валидации и генерации данных с помощью ЛЛМ.
На эти роли мы ищем талантливого NLP Engineer, с которым будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.
Обязанности:
- улучшать качество работы GigaChat на русском и английском языках
- помогать решать бизнес-задачи с помощью нашей технологии сначала для внутренних клиентов в Сбере, а потом и внешним
- придумывать и внедрять новые применения для LLM
- помогать выводить в прод всё, что мы обучим
- постоянно держаться up-to-date со свежими статьями
Требования:
- уверенное владение Python, PyTorch
- знание базовых алгоритмов и математики
- знания в DL, опыт обучения простых и больших моделей
- опыт обучения моделей для продакшена
- понимание текущего состояния эволюции больших LLM'ов
- будет плюсом наличие публикаций.
Условия:
- удалённо
- возможность оформления в аккредитованную IT-компанию
- годовая премия по итогам работы
- регулярный пересмотр зарплат
- корпоративный спортзал и зоны отдыха
- более 400 программ СберУниверситета для роста
- программа адаптации и помощь руководителя на старте
- крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы
- ДМС, льготное страхование для семьи, корпоративная пенсионная программа
- ипотека для сотрудников по дисконтной программе
- СберПрайм+ и скидки у партнёров
- бонус за рекомендации в команду.