Мы – команда рисков и в нашей зоне ответственности следить за качеством разрабатываемых моделей, корректностью их работы в промышленной среде, а также качеством данных, на которых применяются математические модели группы Сбера.
Мы ищем аналитика, способного разобраться, проследить и задокументировать путь данных от источника до модели, вникнуть в бизнес-смысл и донести информацию до разработчиков, а также готового генерировать новые идеи по улучшению процессов проверки данных для предотвращения реализации модельного риска.
Обязанности:
- Проверка соответствия данных бизнес-требованиям;
- Анализ распределения, доверительных интервалов, выбросов, корреляции атрибутов;
- Разработка методологии и реализация тестов для анализа качества данных;
- Поиск атрибутов для расчета различных вариантов целевых событий моделей;
- Оценка влияния изменения входящего потока данных на основные метрики витрин;
- Анализ инструментов оценки качества данных;
- Ведение внутренней документации (Confluence, JIRA);
- Взаимодействие с заказчиками: анализ, уточнение, согласование и контроль бизнес требований к витринам данных;
- Сквозная коммуникация с командами, сопровождающими смежные системы.
Требования:
- опыт работы с инструментами Python (Pandas, pyspark);
- продвинутые знания SQL;
- умение тестировать и документировать собственный код, а также работать с существующим кодом;
- опыт работы с git, bitbucket;
- опыт работы с системами Jira/Confluence или аналогами;
- понимание архитектуры хранилищ данных, ETL-процессов.
Будет плюсом, если ты имеешь:
- знания методов математической статистики;
- опыт практической работы с Hadoop;
- опыт аналитики/разработки хранилищ данных и витрин данных, ETL-процессов.
Условия:
- график работы с 9:00 до 18:00, пятница - до 16:45;
- оформление согласно ТК РФ;
- заработная плата: оклад + годовой бонус;
- социальный пакет + ДМС, спорт, обучение;
- команда профессионалов, готовых поддержать ваши инициативы;
- возможность работы с новыми технологиями;