Senior Data Scientist в команду LLM-разметки в AI VK

VK

Senior Data Scientist в команду LLM-разметки в AI VK

Москва, Садовническая улица, 82

Метро: Павелецкая

Описание вакансии

О проекте. Наша команда управляет контентом, обогащая его дополнительной информацией за счёт ML-моделей, краудсорсинга, LLM. Мы являемся центром экспертизы по автоматизированной разметке, за счёт которой работают рекомендации, поиск, модерация и антифрод. Именно наша команда строит ML-модели и предоставляет предиктивную аналитику по контенту и профилям для бизнес-юнитов холдинга. Для этого мы выстраиваем end-to-end пайплайны обработки и дистрибуции данных, обучаем и используем как классические ML-модели, так и LLM (LLaMa, ChatGPT и другие).

Мы ищем в команду сервиса LLM-разметок Senior Data Scientist с опытом интеграции LLM/VLM в бизнес-процессы компании.

Задачи:

  • построение и улучшение ML-архитектуры процессов обработки данных с использованием внутренних и внешних LLM/VLM;
  • автоматизация за счёт LLM/VLM бизнес-процессов, в которых классические ML-модели недостаточно эффективны;
  • обучение классических ML-моделей, настраивание их качественной и количественной оценки, анализ результатов;
  • работа с краудсорсингом и внутренними инструментами разметки для подготовки Ground Truth данных;
  • взаимодействие с заказчиками, груминги, декомпозиция крупных ML-проектов.

Требования:

  • успешный опыт интеграции LLM/VLM в бизнес-процессы;
  • опыт работы с Python (Pandas, NumPy, SciPy, CatBoost, XGBoost), SQL (оконки, процедуры) — для подготовки данных и обучения ML-моделей;
  • опыт работы с Airflow, BI-системами — Datalens/Superset/Tableu/Power-BI;
  • высшее техническое или математическое образование;
  • более двух лет опыта на позиции Data Science или Machine Learning;
  • хорошие soft-скиллы;
  • умение работать с математической статистикой для управления статзначимостью метрик моделей и пайплайнов;
  • опыт работы с Hadoop, PostgreSQL или YT.
Будет плюсом опыт работы с краудсорсингом и асессорской разметкой.
Навыки
  • LLM
  • Python
  • Apache Airflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

СБЕР
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
USETECH
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Удаленная работа
  • Москва

  • Не указана

Employcity

Data Scientist

Employcity

Удаленная работа
  • Москва

  • Не указана

МТС
Удаленная работа
  • Москва

  • Не указана

Hi, Rockits!
Удаленная работа
  • Москва

  • Не указана

Альфа-Банк

Senior ML-engineer

Альфа-Банк

Удаленная работа
  • Москва

  • Не указана

Звук
Удаленная работа
  • Москва

  • Не указана

билайн
Удаленная работа
  • Москва

  • Не указана

Домклик

Data Scientist NLP

Домклик

Удаленная работа
  • Москва

  • Не указана

Агротехнические Системы

Руководитель ML направления (ML Lead)

Агротехнические Системы

Удаленная работа
  • Москва

  • Не указана

СБЕР
Удаленная работа
  • Москва

  • Не указана

Медиапоинт

Data Scientist (NLP)

Медиапоинт

Удаленная работа
  • Москва

  • Не указана

ДВ СМАРТ
Удаленная работа
  • Москва

  • до 350000 RUR

Hi, Rockits!
Удаленная работа
  • Москва

  • до 350000 RUR

Яндекс
Удаленная работа
  • Москва

  • до 350000 RUR

Контур
Удаленная работа
  • Москва

  • до 350000 RUR

РБК
Удаленная работа
  • Москва

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию