Внимание: проект на 5 месяцев 01.08.2025 - 31.12.2025 с возможностью пролонгации.
Ваша зона ответственности:
Выбор и построение подходящих математических моделей для решения поставленных задач.
Декомпозиция поставленных задач, определение пути решения, установка сроков решения.
Проверка гипотез на основе статистических методов.
Обсуждение выбранных решений с бизнес-заказчиком.
Написание оптимальных SQL/SPARK-запросов, укладывающихся в SLA.
Написание переиспользуемого продуктивного кода SQL/Python (а также его оптимизация).
Использование или создание простых аналитических сервисов (MVP).
Сode-review.
Постановка процессов на регулярную основу.
Настройка мониторинга качества регулярных процессов продукта.
Участие в формировании ТЗ.
Менторинг Junior.
Необходимые навыки:
Python: python (PEP 8).
Способен писать код по заданным стандартам качества.
Знание стандартных алгоритмов и структур данных.
Хорошее владение библиотеками для анализа данных, численных методов.
Умение писать оптимальный по времени и памяти код.
Сложность алгоритмов - дебаг и оптимизация кода.
Разработка через тестирование.
Свободное владение ООП.
Работа с данными: SQL на базовом уровне (join, group by).
Опыт работы с реляционными БД.
Опыт работы на PySpark (broadcast join и тд, Spark UI).
Имеет недоверие к данным, проверяет их на корректность перед использованием.
Может реализовать любой запрос.
Знает оконные функции.
Может определить неоптимальный запрос.
Математика: Знаком с базовой теорией вероятности и статистикой.
Знаком с понятиями АБ-тестирования и проверкой гипотез.
Может решать простые задачи по теории вероятности, статистике, логике.
Знание классических методов ML.
Знание полного цикла проведения АБ теста.
Продвинутое владение аппаратом проверки гипотез.
Множественная проверка гипотез - параметрические/непараметрические методы - бутстреп.
Изучение и имплементация продвинутых моделей ML: - байесовские модели/PGM/VBI, RL и прочее.
Продуктовая аналитика: Работа с хорошо описанными задачами.
Построение аналитические отчётов с заданными требованиями.
Презентация аналитических изысканий, проверенных гипотез и тд.
Погружение в метрики продукта:
понимание основных метрик продукта и их особенностей;
перевод бизнес задач в DS/DA/DE и декомпозиция комплексных бизнес-задач - построение прокси-метрик продукта;.
Стек: Python; SQL; визуализация данных (matplotlib, seaborn, plotly / BI - инструмента); Git; PyTest; Spark 2.2+; Grafana / Airflow
Москва
от 255000 RUR
Москва
до 320000 RUR
Москва
до 250000 RUR
Москва
до 250000 RUR