Привет! Это команда вертикальных поисков.
Современный поиск на маркетплейсе — это не плоский список из тысяч карточек, а умная витрина, которая понимает намерение пользователя и сама группирует товары по тому, что ему важно. Покупатель, который вбивает «ноутбук», на самом деле ищет «игровой», «для учёбы ребёнку» или «тонкий для работы» — и наша задача показать ему эти тематические полки прямо в выдаче, без лишних кликов и фильтров.
Мы называем такие полки нави-колдунами — это автоматически собираемые кластеры товаров внутри поисковой выдачи, которые упорядочивают её по понятным пользователю осям: сценарий использования, ценовой сегмент, тип покупателя, ключевая характеристика. Каждый колдун имеет название, описание и подборку релевантных товаров. Мы ищем DS-специалиста, который будет развивать стрим нави-колдунов: от выделения семантических осей категории до продакшн-ранжирования полок в реальной выдаче Ozon.
Вы будете:
- Разрабатывать и внедрять модели кластеризации товаров для построения тематических полок в поисковой выдаче.
- Проектировать пайплайны автоматической генерации названий и описаний кластеров (в т.ч. с использованием LLM).
- Строить модели ранжирования полок и товаров внутри полок под интент пользователя.
- Работать с товарными эмбеддингами, признаками поведения пользователей и атрибутами карточек для повышения качества кластеризации.
- Заниматься построением пайплайнов обработки и сбора данных, разметкой и обучением моделей.
- Участвовать в полном ML-цикле: от исследования и создания прототипов до продакшн-внедрения, A/B-тестов и мониторинга моделей.
Нам важно:
- Наличие фундаментальной математической базы, знание алгоритмов, математической статистики, классического ML и нейросетей.
- Понимание методов кластеризации, построения эмбеддингов и алгоритмов ранжирования (LTR).
- Опыт работы с современными архитектурами языковых моделей и эмбеддинг-моделей, в том числе обучение/дообучение своих моделей.
- Опыт работы с продуктами в области поиска, рекомендательных систем или рекламных технологий.
- Понимание принципов оценки качества ML-моделей в проде, постановки и анализа A/B-тестов.
Будет плюсом:
- Опыт построения ассистентов или продуктов на базе LLM, генерация структурированного контента (названий/описаний).
- Знание технологий обработки больших данных, таких как Hadoop, Spark или аналогичные.
- Навыки работы с инструментами автоматизации ML-пайплайнов.
- Опыт работы с e-commerce данными: товарные графы, каталоги, пользовательские сессии.