NLP Engineer со знанием и опытом в Reinforcement Learning 12 без позиции
Привет! Это GigaChat Reasoning — команда, которая даёт модели суперсилу размышлять. Мы придумываем среды, тренируем через online RL, ускоряем обучение и доводим решения до продакшна.
Направления
Улучшение GigaChat Reasoning: полный цикл обучения от холодного старта до вывода модели продакшн. Добавление новых доменов, создание датасетов и функций оценки ответов.
Развитие агентских навыков и tool calling с помощью Online RL: создание сред для обучения LLM, обучение и тестирование моделей.
Улучшение продукта Deep Research
На эти роли мы ищем талантливого NLP Engineer со знанием и опытом в Reinforcement Learning. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.
* Удалённо по России.
* Возможность оформления в акктеритованную IT-компанию.
* Годовая премия по итогам работы до 6 окладов.
* Регулярный пересмотр зарплат.
* Корпоративный спортзал и зоны отдыха.
* Более 400 программ СберУниверситета для роста.
* Программа адаптации и помощь руководителя на старте.
* Крупнейшее DS&AI community – более 600 DS банка, регулярный обмен знаниями, опытом и лучшими практиками, интерактивные лекции и мастер-классы от ведущих ВУЗов и экспертов технологических компаний, дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира, регулярные внутренние митапы.
* Расширенный ДМС, льготное страхование для семьи, корпоративная пенсионная программа.
* Ипотека для сотрудников по дисконтной программе.
* СберПрайм+ и скидки у партнёров.
* Бонус за рекомендации в команду.