Наша команда занимается созданием рекомендательных моделей для рекомендации друзей в социальной сети Одноклассники.
Задачи:
- разработка новых и усовершенствование существующих рекомендательных моделей для рекомендации друзей в социальной сети;
- реализация стриминговых сервисов для сбора признаков и применения моделей в продакшене;
- обработка и анализ больших данных;
- проведение А/В-экспериментов и их статистическая оценка.
Требования:
- классическое машинное обучение и математическая статистика;
- хорошее знание Java/Scala и Python (Pandas/Numpy/Scikit-Learn/XGBoost);
- опыт работы с продуктами BigData-стека (Hadoop, Spark);
- понимание принципов работы и подходов к построению рекомендательных систем.
Будет плюсом:
- опыт работы с инструментами потоковой обработки данных (Apache Samza или Spark Streaming);
- представление о современных принципах построения и работы нейронных сетей (Deep Learning, PyTorch/TensorFlow, attention/трансформеры);
- опыт настройки пайплайнов машинного обучения от сбора данных до инференса моделей в продакшене;
- представление о работе с Apache Airflow, MLFlow, Spark ML, Faiss.