Москва, Овчинниковская набережная, 18/1с1
Метро: НовокузнецкаяСейчас мы ищем стажеров в команду разработки и улучшения классических ML-моделей для прогнозирования заказов, нагрузки и оттока курьеров, персонализированных коммуникаций и скидок, а также оптимизации логистики.
Стек технологий:
Разработка: Python, Git, FastAPI, GitLab, Docker, Prometheus, Grafana.
ML инфраструктура: JupyterHub, MLFlow, Airflow.
ML: Scikit-learn, XGBoost, LightGBM, CatBoost, Optuna/Hyperopt, SciPy.
Данные: SQL (PostgreSQL/ClickHouse/GreenPlum), S3, Polars, Pandas, NumPy.
Процессы: Jira, Confluence.
Обязательные навыки и знания:
Знания и умение работать с Python, ООП.
Умение работать с git.
Знания в области классического ML: линейная/логистическая регрессия, деревья решений, методы кластеризации, оптимизации, градиентный бустинг, различные виды лесов.
Знание каких-либо библиотек классического ML (Scikit-learn, XGBoost, LightGBM, CatBoost)
Понимание основных метрик качества моделей (accuracy, precision, recall, F1, ROC-AUC, RMSE, MAE) и методов валидации (кросс-валидация, train/test split).
Уверенное владение SQL и Python для анализа данных (Polars, Pandas, NumPy, JupyterHub).
Знание основ feature engineering, отбора признаков и работы с пропущенными значениями.
Навыки которые будут плюсом:
Знакомство с фреймворками для оптимизации гиперпараметров (Optuna, Hyperopt).
Базовое понимание концепций A/B-тестирования.
Обучение и инференс классических ML алгоритмов на GPU.
Прогнозирование временных рядов: декомпозиция, кросс-валидация во времени, базовые модели (AR, сглаживание).
Uplift-моделирование: понимание отличий от классификации, типы клиентов.
Рекомендательные системы: виды фидбека, базовые подходы (collaborative, content-based), метрики ранжирования (Precision@k, NDCG).
Оптимизация: базовые алгоритмы (жадные, графовые), понимание постановок задач.
Сбор, постановка задачи разметки, предобработка, EDA данных, выбор offline/online метрик
Составление и согласование дизайна ML решения
Обучение классических ML моделей
Продуктовизация (пайплайны данных, перетренировка)
Процесс отбора на стажировку выглядит так:
резюме и короткая анкета в ответ;
тестовое задание объемом ~3 часа;
интервью с командой;
предложение работы.
Наши стажировки оплачиваемые, длятся 3 месяца или дольше, 30-40 рабочих часов в неделю в гибком графике.
Вы будете постепенно включаться в реальные процессы разработки ML моделей: от выполнения небольших, хорошо структурированных задач, под присмотром опытного наставника до участия в обсуждении архитектуры и принятия решений. В конце стажировки сможете работать с проектами на уровне junior+ рDS, понимать бизнес-задачи и вносить осознанный вклад в развитие платформы.
Москва
до 100000 RUR
Москва
до 121000 RUR
non-food FMCG company
Москва
до 100000 RUR