Юзтех – группа аккредитованных ИТ-компаний полного цикла разработки с многолетней экспертизой в передовых технологиях: DWH, BigData, AI/ML, Blockchain, BI, предиктивная аналитика, цифровые двойники производства и рисков.
ГК Юзтех является технологическим партнером таких компаний, как Mail.ru, 2Gis, НЛМК, Еврохим, ГоИнвест, Альфа-Банк, Сбер, ВТБ, МКБ, Самолет, Х5 retail Group, Газпромнефть, Леруа Мерлен, Ситилинк, Ланит, IBS. Также, ГК разрабатывает собственные IT-продукты (Usebus, Octopus, Тил Эйчар) и флагманские проекты, которыми пользуется 70% населения страны.
Приглашаем Senior Data Scientist присоединиться к команде Юзтех!
Задачи позиции: Ты будешь экспертом в команде, который превращает хаотичные данные о продажах, товарах, клиентах и внешних факторах в точные прогнозы. От точности этих моделей зависит, сколько продукта окажется на полках, когда и где — а значит, и успех всей компании.
Технологический стек:
SQL (GreenPlum, Postgres)
Python (проверка гипотез, EDA, автоматизация)
Airflow (запуск и мониторинг дата-пайплайнов)
Power BI (создание аналитических дашбордов)
MS Power Point (презентации, отчёты для бизнеса)
Miro (визуализация процессов, фасилитации, доски гипотез)
Основные обязанности:
Сбор и подготовка данных:
Извлечение, очистка и агрегация данных из различных источников
Построение пайплайнов загрузки и трансформации данных
Разработка моделей прогнозирования:
Построение и тестирование моделей временных рядов
Применение ML/MLP подходов
Интеграция внешних факторов
Оценка и валидация моделей:
Подбор метрик качества
Проведение кросс-валидации и A/B тестирования.
Оценка устойчивости модели к выбросам и сезонности.
Взаимодействие с командой:
Совместная работа с продакт-менеджером над уточнением бизнес-гипотез.
Участие в аналитике гипотез и приоритизации фичей.
Поддержка и обучение бизнес-пользователей модели.
Что нужно (требования) - Must have в резюме:
• Опыт в Data Science / Machine Learning от 2 лет.
• Умение четко оценивать сроки и реалистично подходить к постановке задач.
• Прагматизм: готовность искать рабочие решения, а не идеальные, но нереализуемые модели.
• Ответственность: завершать проекты, а не бросать их на полпути.
• Глубокое знание Python, SQL и PySpark:
Разработка ETL-процессов для обработки больших данных (чтение, трансформация, агрегация, запись).
Оптимизация Spark-запросов (партиционирование, кэширование, работа с broadcast-переменными).
• Знание основных ML-фреймворков (Scikit-learn, TensorFlow/PyTorch).
• Опыт работы с данными: обработка, анализ, feature engineering.
• Общительность и неконфликтность – умение работать в команде и эффективно коммуницировать с коллегами.
• Обязательно опыт с временными рядами и прогнозированием.
• Знание статистических методов прогнозирования (ETS, ARIMA, наивные подходы), машинное обучение (бустинги, линейные регрессии и тп), плюс знание подходов глубинного обучения (RNN, LSTM, трансформеры и тп).
Плюсом будет:
• Опыт продакшн-разработки (не только исследования).
• Понимание, как устроены процессы в бизнесе, а не только в Jupyter Notebook.
• Опыт работы с процессами логистики.
• Умение запускать ML-модели в PySpark:
Использование Spark MLlib для распределенного обучения.
Работа с PySpark Pandas UDFs для эффективного применения ML-моделей к большим данным.
Мы предлагаем:
Москва
Не указана