Алматы, улица Каныша Сатпаева, 22В/1
Метро: АбаяОсновные обязанности:
- Разработка, обучение и внедрение моделей машинного обучения и/или глубокого обучения;
- Анализ и подготовка данных: сбор, очистка, предобработка, feature engineering;
- Выбор и обоснование архитектур моделей (ML / DL) под задачи бизнеса;
- Обучение, валидация и оптимизация моделей (оценка качества, переобучение, метрики);
- Работа с большими объёмами данных и различными источниками данных;
- Оптимизация производительности моделей и времени инференса;
- Поддержка и обновление моделей в продуктивной среде (ML lifecycle);
- Взаимодействие с backend-разработчиками, аналитиками, продуктовой командой;
- Подготовка технической документации и описание решений.
Опционально:
- Интеграция ML-моделей в продукты и сервисы (API, backend, мобильные приложения).
Ключевые требования.
1. Программирование и инструменты:
- Python на уровне глубоких знаний и библиотек обработки данных, в том числе: Pandas, NumPy, Scikit-learn, SQL и подобные;
- ML-фреймворки PyTorch и/или TensorFlow/Keras, имея опыт работы с ними;
- Базы данных, работа с различными форматами (Табличные, YAML, JSON, Текстовые и подобные) и уметь работать с инструментами Big Data;
- Инженерные навыки (Опционально): Git, Docker, понимание работы API (REST, FastAPI) и SOAP.
- умение извлекать данные из различных источников (файлы, API, базы данных)
- Уметь проводить EDA и визуализировать его результаты.
2. Математическая база:
- Линейная алгебра и матанализ, чтобы понимать, как работают алгоритмы;
- Теория вероятностей и статистика для оценок достоверности результатов и проверки гипотез.
3. Специальные знания в ML:
- Классическое машинное обучение, включающее: Деревья решений, Случайные леса, Градиентный бустинг (XGBoost, CatBoost) и не только;
- Глубокое обучение (Deep Learning). Архитектуры нейронных сетей (CNN для изображений, RNN/Transformers для текстов);
- NLP и/или Computer Vision и обработки временных рядов. Специализация на обработке естественного языка или компьютерного зрения (в зависимости от профиля компании).
- Важно умение строить архитектуры ML-кластеров и высокоскоростных сетей (10–400 Гбит/с).
- уметь замерять качество работы алгоритмов с помощью модельных метрик и проводить их тестирование.
- Работать с NLP/CV-задачами с помощью классических методов ML и Deep Learning.