О компании
Vi-Ortis — казахстанская компания, специализирующаяся на аналитике и IT-решениях для фармацевтического рынка.
Мы создаём интеллектуальные продукты для дистрибьюторов, аптечных сетей и производителей, помогая им принимать более точные управленческие решения на основе данных.
Vi-Ortis входит в состав Mladex Pharm Consulting Group, в которую также входят:
PharmIT — разработка цифровых решений для автоматизации процессов на фармрынке
Казахстанский фармацевтический вестник (КФВ) — отраслевое медиа о фарме и здравоохранении
У нас сильная внутренняя экспертиза, устойчивые процессы и фокус на развитии. Мы запускаем новое направление в области Data Science и ищем специалиста, который поможет нам усилить его.
Задачи
- Проведение исследовательского анализа данных (EDA)
- Очистка и подготовка данных
- Построение моделей машинного обучения: классификация, регрессия, ансамбли
- Кластеризация и сегментация объектов на основе признаков
- Оценка качества моделей: метрики, кросс-валидация, гиперпараметры
- Работа с ML-пайплайнами (sklearn pipeline)
- (Опционально) Развёртывание модели в виде API (FastAPI / Flask)
Требования
- Обязательные навыки:
- Уверенное владение Python: pandas, numpy, scikit-learn, matplotlib, seaborn, xgboost
- Понимание классических алгоритмов машинного обучения
- Опыт подготовки и очистки данных
- Навыки оценки моделей с использованием метрик (RMSE, MAE, ROC AUC и др.)
- Знание SQL (объединения, фильтрация, агрегации)
2. Будет плюсом:
- Опыт работы с LightGBM, Optuna, MLflow
- Базовые навыки API (FastAPI или Flask)
- Понимание принципов кластеризации и PCA
- Навыки визуализации в Power BI
- Знание основ матстатистики, линейной алгебры, математического анализа
Что мы предлагаем
- Работа с реальными данными фармацевтического рынка
- Доступ к аналитике высокого уровня и экспертной поддержке
- Гибкий график, возможность удалённой работы
- Развитие внутри компании: обучение, новые задачи, рост
- Сильная команда, выстроенные процессы, уважительное отношение
Этапы отбора
- Рассмотрение резюме
- Тестовое задание, включающее:
- EDA и прогнозирование на основе реальных обезличенных данных продаж
- Классификацию хитов продаж
- Кластеризацию торговых точек
- SQL-задачу
- Несколько теоретических задач по статистике, линейной алгебре и анализу
- Задание рассчитано на 3–5 часов, присылается после первичного одобрения.
3. Интервью с техническим специалистом
4. Финальное решение и предложение