Мы развиваем крупную онлайн-платформу с высокой пользовательской активностью. В рамках отдельного проекта создаём ML-систему оценки риска аккаунтов, основанную на анализе структурированных данных и текстовой информации, с целью раннего выявления мошеннических и недобросовестных сценариев поведения.
Проект прикладной, ориентирован на внедрение в продукт и последующее масштабирование.
Задачи проекта
- Разработка ML-моделей для анализа текстовой информации в составе риск-скоринга аккаунтов.
- Формирование обучающих выборок на основе исторических данных и событийных логов.
- Построение витрин признаков с учётом временных срезов (as-of, без утечки будущего).
- Обучение, валидация и сравнение моделей (baseline → продакшен).
- Подготовка решений к внедрению: инференс, пороги, рекомендации по интеграции.
- Проработка подходов к мониторингу качества и регулярному переобучению.
Требования
- Коммерческий опыт в Machine Learning от 4 лет.
- Практический опыт работы с анализом текстовой информации (NLP).
- Уверенное владение Python (pandas, scikit-learn).
- Опыт обучения нейросетевых моделей (PyTorch).
- Хороший уровень SQL, опыт работы с аналитическими выборками.
- Понимание антифрод- и скоринговых задач (дисбаланс классов, шумные данные, метрики).
Будет плюсом
- Опыт в Text Analytics, NLP, content moderation, trust & safety.
- Работа с большими объёмами текстовых данных.
- Опыт внедрения ML-моделей в продакшен.
- Знание MLOps-практик (Docker, MLflow, Airflow).
- Опыт оптимизации инференса и высоконагруженных сервисов.
Условия
- Проектная работа с чётко определёнными этапами и результатами.
- Оплата по договорённости (фикс / этапы / T&M).
- Возможность долгосрочного сотрудничества.
- Минимум бюрократии, прямое взаимодействие с командой.