Ищем человека на роль Senior Data Scientist в направление работы с внутренними клиентами Банка, отдел Монетизации нейронных сетей, который отвечает за разработку R&D решений для Core-бизнеса банка.
Тебе предстоит решать сложные и амбициозные задачи на стыке различных направлений деятельности: оценка риска, cltv, склонность, рекомендации.
На данной позиции предстоит заниматься задачами, связанными с графами и/или RL для оптимизации процессов принятия решений.
Общаться с бизнес-заказчиками и контрагентами, ответственными за все этапы жизненного цикла моделей.
Команда сфокусирована на построении сложных процессов и моделей на стыке R&D и Run деятельности, поэтому на позиции будет очень важны hard-скиллы.
Ваша зона ответственности:
- Разрабатывать, поддерживать и внедрять модели в процессы банка с упором на Change-деятельность (развитие новых, ещё не опробованных в банке подходов)
- Участвовать в коммуникации с бизнес-заказчиками: проводить интервью заказчика, формулировать технические и бизнес-требования к разрабатываемым моделям, презентовать результаты разработки моделей, оценивать их финансовый эффект
- Оптимизировать и дорабатывать внутренних фрейморков для борьбы с рутиной
- Разрабатывать дизайн экспериментов для оценки качества моделей в бизнес-процессах
- Совместно с командой DE реализовывать ETL-процессы подготовки данных для моделей
- Совместно с командой MLOps отвечать за внедрение моделей в систему исполнения и дальнейшую интеграцию с системами заказчика
- Совместно с командой мониторинга ставить разработанные модели на регулярный мониторинг
- Искать и проверять гипотезы по улучшению моделей за счет использования новых источников данных и архитектур
Необходимые навыки:
- Знания в RL и Графовых нейросетях
- Отличные знания в области классического ML и DL
- Подтверждённый опыт реализации и внедрения моделей в бизнес-процессы
- Как большой плюс - опыт в построении моделей рисков
- Опыт работы с "джентельменским" набором DL инженера: torch, pandas, numpy, networkX, PyG, matplotlib, classicML libs
- Опыт работы с системами хранения и обработки данных, у нас hdfs/spark