Data Scientist

Описание вакансии

Обязанности

• Погружение: разобраться в бизнес контексте, данных и инфраструктуре.

• Анализ текущего решения: изучить существующее решение и найти его слабое место — как в самом подходе, так и в таргете, признаках при наличии.

• R&D: Опробовать разные ML подходы: классификация, кластеризация, uplift и ранжирующие модели, нейросети (можно часть из них). Сравнить имеющееся решение и опробованные

• Валидация: проверить качество offline метриками (AUC/PR, NDCG для ранжирования, uplift метрики и др.), убедиться, что есть статистически значимый прирост в точности

• Итог: написать статью/отчёт со сравнением методов. Если получится — запускаем лучшее решение в прод в параллель с имеющимся и проводим ABC тест.

Требования

• Стек: Уверенный Python, продвинутый SQL. Базовое понимание PySpark — плюс.

• Классический ML: Хорошие знания алгоритмов. Бустинги, деревья, логистическая и линейная регрессия, кластеризация, uplift и ранжирующие модели (плюс), работа с дисбалансом, калибровка.

• Deep Learning / RecSys / NLP - плюс: Базовые представления о нейронных сетях (MLP, embeddings), рекомендательных системах и NLP задачах.

• Математика и аналитика: Теория вероятностей, доверительные интервалы, статистические тесты, бутстрэп.

• Soft skills: Чёткая коммуникация и самостоятельность в отладке кода.

Условия

• Сильное DS community, большое разнообразие рабочих и внерабочих активностей;

• Конкурентную заработную плату, соцпакет;

• Условия для роста и развития (в т.ч. конференции, тренинги, внутренние программы развития).

• Дружный коллектив единомышленников (все специалисты, занимающиеся машинным обучением объединены одним департаментом для максимально плотного и продуктивного обмена знаниями).

• Передовой стек технологий, высокопроизводительное оборудование.

• Возможность решать разнообразные прикладные задачи с выводом в промышленную эксплуатацию, возможность существенно влиять на результат (в т.ч. в бизнес-смысле) и способы его достижения (вплоть до внесения изменений в архитектуру).

• Квартальный бонус по результатам работы;

• ДМС, страхование жизни;

• Корпоративное обучение;

Навыки
  • Python
  • SQL
  • Hadoop
  • PySpark
  • Apache Spark
  • Spark
Посмотреть контакты работодателя

Похожие вакансии

Домклик

Data Scientist NLP

Домклик

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Hi, Rockits!
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
X5 Tech
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
YADRO
Удаленная работа
  • Москва

  • Не указана

Лемана ПРО
Удаленная работа
  • Москва

  • Не указана

ДОМ.РФ
Удаленная работа
  • Москва

  • Не указана

Hi, Rockits!
Удаленная работа
  • Москва

  • Не указана

Rambler&Co
Удаленная работа
  • Москва

  • Не указана

CodeScoring

Data Engineer

CodeScoring

Удаленная работа
  • Москва

  • Не указана

Effective
Удаленная работа
  • Москва

  • до 320000 RUR

Мокка
Удаленная работа
  • Москва

  • до 320000 RUR

DENUM GROUP

Data Analyst (DWH)

DENUM GROUP

Удаленная работа
  • Москва

  • до 320000 RUR

WILDBERRIES
Удаленная работа
  • Москва

  • до 320000 RUR

Диплей

Data Engineer [Middle]

Диплей

Удаленная работа
  • Москва

  • до 320000 RUR

Ozon
Удаленная работа
  • Москва

  • до 320000 RUR

Инвиста

Data Engineer middle

Инвиста

Удаленная работа
  • Москва

  • до 2000 USD

IBS
Удаленная работа
  • Москва

  • до 2000 USD

Qugo
Удаленная работа
  • Москва

  • до 2000 USD

Медиапоинт
Удаленная работа
  • Москва

  • до 2000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию