Москва, улица Василисы Кожиной, 1
Метро: Парк ПобедыРОМИР – лидер исследований в России в сферах психологии, социологии, маркетинга, демографии и статистики, работаем более чем в 60 странах мира. Более 30 лет мы занимаемся глубинными исследованиями в евразийском пространстве, развивая инновационные инструменты, опираясь на фундамент социальных наук.
Мы активно сотрудничаем с крупнейшими университетами, бизнесом и государственными организациями.
Если вы стремитесь к инновациям и хотите быть частью динамичной компании, то эта вакансия для вас!
Приглашаем присоединиться к нашей команде Data Science ассистента.
Ключевая задача: работа в команде Data Science над задачами в области аналитики и обработки больших объёмов данных. Основной фокус — реализация ML-гипотез по подготовленным ТЗ, эксперименты с моделями и подготовка данных для обучения. С предоставлением отчёта по каждой гипотезе с описанием реализуемых подходов на основании выбранных метрик качества на тестовой выборке.
Чем предстоит заниматься:
Работа с данными. Сборка выборок из корпоративных витрин (SQL) по поставленным ТЗ.
Разметка и валидация данных различными объёмами — для подготовки обучающих выборок, оценки качества моделей и контроля автоматической разметки.
Формирование сбалансированных датасетов для дальнейшего обучения.
Реализация ML-гипотез и LLM-пайплайнов. Имплементация поставленных гипотез: подготовка данных, обучение моделей, тестирование подходов (классический ML, эмбеддинги и векторные представления), построение пайплайнов на LLM через API и локально.
Снятие метрик, выполнение экспериментов по чек-листу на разных параметрах, сравнение подходов, фиксация результатов в воспроизводимом виде, оформление отчётов.
R&D. Участие в исследовательской части проектов: разбор актуальных статей и решений в области LLM и классического ML, поиск релевантных подходов под текущие задачи команды.
Подготовка кратких обзоров найденных методов с оценкой применимости.
Проверка перспективных подходов на пилотных выборках.
Python: уверенное владение, знание основных библиотек (pandas, numpy, scikit-learn и пр,).
Классический ML: понимание основных алгоритмов (линейные модели, деревья, градиентный бустинг и пр.), умение корректно подбирать метрики под задачу и интерпретировать результаты.
Векторные представления: понимание эмбеддингов, умение работать с векторными моделями (sentence-transformers, embedding-модели), опыт работы с векторным поиском.
LLM: понимание принципов работы языковых моделей, опыт построения промптов, работа с локальными моделями; ориентация в актуальных подходах (RAG, few-shot, structured output)
SQL: уверенный пользователь.
API: опыт использования API
Git: базовая работа с ветками, коммитами, мерж.
Банк Русский Стандарт
Москва
Не указана