Москва
Метро: Библиотека им.ЛенинаМы ищем аналитика-разработчика в команду ML Safety Алисы, чтобы вместе строить системы оценки качества ответов как LLM, так и t2i- и i2i-моделей.
Почему у нас классно:
Построение системы оценки качества ответов моделей
Вам предстоит разработать и внедрить системы VLM-as-a-judge и LLM-as-a-judge для автоматической оценки ответов наших моделей. Это ключевой шаг в переходе от устаревших подходов к современным методам контроля качества, который напрямую повлияет на развитие продукта.
Формализация требований к качеству продукта
Наша основная задача — превратить плохо формализованное и противоречивое определение продукта в набор чётких правил и принципов, с помощью которых мы сможем обозначить конкретный ответ как хороший (подходящий для продукта) или плохой (указывающий на ошибку в продукте) и обосновать такое решение. Сначала мы учимся делать это сами (собираем и обсуждаем примеры, пишем инструкции), а затем обучаем этому AI-тренеров и асессоров.
Аналитические задачи вокруг ML-моделей
Мы оптимизируем сбор лёрна, занимаемся валидацией и приёмкой моделей, мониторим состояние прода, ищем проблемы.
Аналитическое кредитное рейтинговое агентство (АКРА)
Москва
Не указана
Москва
Не указана
АТОЛ, группа компаний
Москва
Не указана