Обязанности:
Извлечение данных из различных источников (базы данных, API, лог-файлы и пр.);
Очистка, трансформация и подготовка данных к анализу (data wrangling)
Выявление закономерностей, трендов, аномалий;
Проведение статистического анализа и проверка гипотез.
Разработка, обучение и валидация моделей (регрессия, классификация, кластеризация и т.д.);
Оптимизация гиперпараметров и выбор лучших алгоритмов.
Создание решений, которые могут быть внедрены в продукт (например, рекомендательные системы, прогнозы спроса и пр.);
Тестирование алгоритмов в продакшене (A/B-тесты, метрики качества модели).
Подготовка интерактивных отчетов, графиков, дешбордов;
Представление результатов команде, бизнес-заказчику, менеджменту.
Взаимодействие с продуктологами, инженерами, аналитиками, дизайнерами;
Участие в формулировании бизнес-задач и переводе их в ML-задачи.
Мониторинг качества моделей в продакшене;
Регулярное обновление и переобучение моделей по мере накопления новых данных.
Ведение технической документации;
Обеспечение воспроизводимости моделей и экспериментов.
Работа с Big Data (Spark, Hadoop);
Разработка моделей с использованием нейросетей (deep learning);
Применение NLP, CV, time series;
Разработка MLOps решений (CI/CD, docker, MLflow, Airflow и пр.).
Требования:
Высшее образование в области математики, статистики, компьютерных наук, физики или смежных дисциплин;
Уверенное владение Python (или R), знание библиотек: pandas, numpy, scikit-learn, matplotlib, seaborn и др.;
Знание SQL, умение извлекать и обрабатывать данные из БД;
Опыт построения и оценки моделей машинного обучения;
Знание статистики и методов анализа данных (корреляция, регрессия, тестирование гипотез);
Навыки визуализации данных (например, с помощью matplotlib, seaborn, Plotly или BI-инструментов);
Умение формулировать и решать бизнес-задачи с помощью данных;
Опыт работы с Git, Jupyter, Docker, MLflow и пр. — приветствуется;
Английский язык — на уровне чтения технической документации и ведения переписки (часто требуется);
Опыт работы с Big Data, нейросетями, NLP или MLOps — будет плюсом.
Если вы не получили ответ в течение 7 дней, ваша заявка не была выбрана для дальнейшего рассмотрения. Наша команда благодарит вас за уделенное нашей компании время.