Привет! Это команда ML ценообразования. Сейчас в команде 2 человека, которые сделали MVP – на A/B тестах стабильно позитивные результаты. Основная цель на ближайшее время – определить стратегию дальнейшего развития системы. Цель на долгосрок – разработать устойчивое решение, которое учитывает не только краткосрочную выгоду, но и сайд-эффекты и последствия. Сейчас пайплайн переводится с hadoop в сервисы, и в дальнейшем поддержкой production и всей технической стороной проекта будет заниматься соседняя команда, а мы сосредоточимся на математической составляющей задачи.
Этот проект – борьба с шумными данными, сложными метриками и неочевидными решениями. Мы ищем человека, который готов бороться за каждую десятую процента на А/Б, за качество и безопасность решений, за долгосрочный эффект. Который не ищет легких путей, но хочет побеждать вместе с командой. Если процесс преодоления доставляет вам особое удовольствие, и вы хотите привнести в сильную команду свое видение – нам точно стоит познакомиться!
Вы будете
- Анализировать большие объёмы данных с помощью PySpark для поиска неочевидных закономерностей.
- Исследовать и улучшать ML-решения на реальных шумных данных – от гипотезы до оценки влияния на А/Б-тесты (без погружения в production-инженерию: пайплайн и поддержку возьмёт соседняя команда).
- Разрабатывать и проверять новые факторы для моделей, добиваясь стабильного прироста метрик.
- Проектировать эксперименты и инструменты валидации, чтобы отделить реальный эффект от шума и случайностей.
- Оценивать долгосрочные последствия решений, выявлять и анализировать сайд-эффекты.
- Участвовать в архитектурных обсуждениях (как лучше строить фичи, валидацию, сценарии использования) без рутинной поддержки кода в проде.
Нам важно
- Отличная математическая база.
- Коммерческий опыт в DS от 4 лет – обязательно с задачами, где данные были шумными или недостаточно разнообразными.
- Опыт работы с PySpark на реальных объёмах данных (именно для анализа и генерации фичей, а не для написания production-пайплайнов).
- Опыт постановки и интерпретации А/Б-тестов.
- Умение и желание копать в глубину: не остановиться на первом сработавшем решении, а проверять устойчивость, смотреть на сайд-эффекты, пробовать альтернативные подходы.
- Прагматизм и ориентацию на результат – умение быстро проверять гипотезы, при этом не скатываясь в бесконечный research.
Будет плюсом
- Опыт в ML ценообразовании.
- Опыт успешного применения Causal Inference подходов.