Старший Data Scientist, ML ценообразование

Москва, Пресненская набережная, 10блокС

Метро: Деловой центр

Описание вакансии

Привет! Это команда ML ценообразования. Сейчас в команде 2 человека, которые сделали MVP – на A/B тестах стабильно позитивные результаты. Основная цель на ближайшее время – определить стратегию дальнейшего развития системы. Цель на долгосрок – разработать устойчивое решение, которое учитывает не только краткосрочную выгоду, но и сайд-эффекты и последствия. Сейчас пайплайн переводится с hadoop в сервисы, и в дальнейшем поддержкой production и всей технической стороной проекта будет заниматься соседняя команда, а мы сосредоточимся на математической составляющей задачи.

Этот проект – борьба с шумными данными, сложными метриками и неочевидными решениями. Мы ищем человека, который готов бороться за каждую десятую процента на А/Б, за качество и безопасность решений, за долгосрочный эффект. Который не ищет легких путей, но хочет побеждать вместе с командой. Если процесс преодоления доставляет вам особое удовольствие, и вы хотите привнести в сильную команду свое видение – нам точно стоит познакомиться!

Вы будете

Анализировать большие объёмы данных с помощью PySpark для поиска неочевидных закономерностей.
Исследовать и улучшать ML-решения на реальных шумных данных – от гипотезы до оценки влияния на А/Б-тесты (без погружения в production-инженерию: пайплайн и поддержку возьмёт соседняя команда).
Разрабатывать и проверять новые факторы для моделей, добиваясь стабильного прироста метрик.
Проектировать эксперименты и инструменты валидации, чтобы отделить реальный эффект от шума и случайностей.
Оценивать долгосрочные последствия решений, выявлять и анализировать сайд-эффекты.
Участвовать в архитектурных обсуждениях (как лучше строить фичи, валидацию, сценарии использования) без рутинной поддержки кода в проде.

Нам важно

Отличная математическая база.
Коммерческий опыт в DS от 4 лет – обязательно с задачами, где данные были шумными или недостаточно разнообразными.
Опыт работы с PySpark на реальных объёмах данных (именно для анализа и генерации фичей, а не для написания production-пайплайнов).
Опыт постановки и интерпретации А/Б-тестов.
Умение и желание копать в глубину: не остановиться на первом сработавшем решении, а проверять устойчивость, смотреть на сайд-эффекты, пробовать альтернативные подходы.
Прагматизм и ориентацию на результат – умение быстро проверять гипотезы, при этом не скатываясь в бесконечный research.

Будет плюсом