Ассистент Data Science

Москва, улица Василисы Кожиной, 1

Метро: Парк Победы

Описание вакансии

РОМИР – лидер исследований в России в сферах психологии, социологии, маркетинга, демографии и статистики, работаем более чем в 60 странах мира. Более 30 лет мы занимаемся глубинными исследованиями в евразийском пространстве, развивая инновационные инструменты, опираясь на фундамент социальных наук.

Мы активно сотрудничаем с крупнейшими университетами, бизнесом и государственными организациями.

Если вы стремитесь к инновациям и хотите быть частью динамичной компании, то эта вакансия для вас!

Приглашаем присоединиться к нашей команде Data Science ассистента.

Ключевая задача: работа в команде Data Science над задачами в области аналитики и обработки больших объёмов данных. Основной фокус — реализация ML-гипотез по подготовленным ТЗ, эксперименты с моделями и подготовка данных для обучения. С предоставлением отчёта по каждой гипотезе с описанием реализуемых подходов на основании выбранных метрик качества на тестовой выборке.

Чем предстоит заниматься:

Работа с данными. Сборка выборок из корпоративных витрин (SQL) по поставленным ТЗ.
Разметка и валидация данных различными объёмами — для подготовки обучающих выборок, оценки качества моделей и контроля автоматической разметки.
Формирование сбалансированных датасетов для дальнейшего обучения.

Реализация ML-гипотез и LLM-пайплайнов. Имплементация поставленных гипотез: подготовка данных, обучение моделей, тестирование подходов (классический ML, эмбеддинги и векторные представления), построение пайплайнов на LLM через API и локально.
Снятие метрик, выполнение экспериментов по чек-листу на разных параметрах, сравнение подходов, фиксация результатов в воспроизводимом виде, оформление отчётов.

R&D. Участие в исследовательской части проектов: разбор актуальных статей и решений в области LLM и классического ML, поиск релевантных подходов под текущие задачи команды.
Подготовка кратких обзоров найденных методов с оценкой применимости.
Проверка перспективных подходов на пилотных выборках.

Требования:

Python: уверенное владение, знание основных библиотек (pandas, numpy, scikit-learn и пр,).
Классический ML: понимание основных алгоритмов (линейные модели, деревья, градиентный бустинг и пр.), умение корректно подбирать метрики под задачу и интерпретировать результаты.
Векторные представления: понимание эмбеддингов, умение работать с векторными моделями (sentence-transformers, embedding-модели), опыт работы с векторным поиском.
LLM: понимание принципов работы языковых моделей, опыт построения промптов, работа с локальными моделями; ориентация в актуальных подходах (RAG, few-shot, structured output)
SQL: уверенный пользователь.
API: опыт использования API
Git: базовая работа с ветками, коммитами, мерж.

Условия:

Работа в одной из самых динамично развивающихся компаний на российском исследовательском рынке;
Работа с молодой командой профессионалов, которые горят своим делом и нацелены на результат;
Возможность участия в самых крупных российских исследовательских проектах;
Оформление в соответствии с ТК РФ.
Комфортный современный офис в шаговой доступности от ст. м. Багратионовская, м. Фили и Парк Победы;
Уровень заработной платы обсуждается с успешным кандидатом на собеседовании.
График работы с 9.30 до 18.00, 5/2 суббота и воскресенье выходные.