Владение Python и связанным с ним стеком для ML: pandas, scikit-learn, XGBoost / CatBoost / LightGBM, PyTorch, optuna.
Опыт работы с CV: классификация, детекция, сегментация.
Опыт работы с NLP: transformers, SentenceTransformer (embeddings).
Опыт работы с FastAPI.
Знание Git.
Знание Docker.
Будет плюсом:
Знание Linux.
Знание SQL.
Опыт запуска локальных LLM (llama-server).
Опыт проведения код ревью.
Опыт оптимизации моделей для встраивания их в production.
Задачи:
Подготовка данных для обучения моделей: взаимодействие с разметчиками, очистка, train/val/test сплиты, контроль data leakage.
Обучение и дообучение ML моделей (CV: классификация/детекция/сегментация; NLP: transformers/embeddings), тюнинг гиперпараметров, логирование экспериментов.
Разработка сервисов для встраивания ML моделей в production (FastAPI, Docker), интеграция в существующие системы.