Очищать, обрабатывать и исследовать 200+ признаков, влияющих на риск оттока клиентов
Строить точную модель прогнозирования оттока клиентов с применением технологий машинного обучения (Python, Scikit-learn, Pandas, NumPy).
Использовать методы feature selection для выбора важнейших факторов риска
Оптимизировать гиперпараметры и повышать точность модели.
Создавать пайплайны на Spark, Hadoop и Airflow для регулярного обновления и эксплуатации модели.
Документировать процесс и предоставление отчетов по результатам работы.
Мы ждем от тебя:
Опыт участия в качестве Data Science специалиста на проектах по анализу данных и созданию моделей машинного обучения не менее 2-х лет, предпочтительно в банковской отрасли
Знание статистических подходов и методов, опыт их применения
Опыт подготовки и анализа данных
Опыт применения алгоритмов машинного обучения, методов оценки эффективности моделей
Знания Python и основных библиотек анализа данных и машинного обучения
Знание SQL, опыт работы с одной из реляционных СУБД
Опыт работы с неструктурированными и слабоструктурированными данными
Опыт визуализации результатов анализа, подготовки презентаций
Желателен опыт работы с инструментами распределенной обработки данных, Hadoop, Spark, MPP СУБД
Опыт командной разработки с использованием систем контроля версий (GIT), Jira, Confluence, CI/CD
"Технический" английский
Что мы обеспечим:
Возможность удаленной работы
Гибкое начало рабочего дня
Технику для комфортной работы
ДМС со стоматологией после прохождения испытательного срока