Присоединяйтесь к команде профессионалов, работающих над уникальными проектами в сфере Data Science и Generative AI. Мы создаём передовые решения, автоматизирующие бизнес-процессы, и внедряем современные ML-модели. Мы ищем как талантливых начинающих специалистов (Junior), готовых быстро расти, так и опытных инженеров (Middle/Middle+). Если вы хотите работать с актуальным LLM-стеком (PyTorch, LangChain, векторные БД) и решать реальные задачи бок о бок с сильными специалистами, ждём вас в нашей команде!
Должностные обязанности:
- участие в проектировании и разработке систем на базе больших языковых моделей (LLM);
- построение, тестирование и оптимизация пайплайнов RAG (Retrieval-Augmented Generation);
- организация процессов сбора и подготовки данных, автоматизация обработки данных и контроль качества для повышения точности RAG-систем;
- разработка и поддержка API для интеграции ML-моделей (FastAPI);
- контейнеризация сервисов (Docker) и участие в деплое моделей на внутренних (on-premise) серверах компании;
- написание чистого, документированного кода по методологиям Agile/Scrum.
Общие требования (Must-have):
- высшее образование в STEM (законченное или на старших курсах);
- уверенное знание Python (FastAPI, pandas, NumPy, scikit-learn, PyTorch);
- понимание архитектуры трансформеров, принципов работы LLM и RAG;
- знакомство с векторными базами данных (Qdrant, ChromaDB или pgvector) и фреймворками LangChain/LangGraph;
- базовые навыки работы с Linux, Git и Docker;
- уровень английского языка B2+ (свободное чтение технической документации и научных статей).
Требования к опыту (в зависимости от уровня):
- Для уровня Junior: сильная теоретическая база, наличие профильных пет-проектов (GitHub), участие в Kaggle, хакатонах или исследовательских проектах.
- Для уровня Middle и выше: опыт коммерческой разработки от 12 до 18 месяцев (в роли ML Engineer, Data Scientist или Python Backend), практический опыт вывода ML/LLM моделей в продакшен.
Будет значительным плюсом:
- опыт работы с vLLM, понимание методов квантования (AWQ, GPTQ, GGUF) и оптимизации потребления видеопамяти (VRAM);
- знакомство с фреймворками для оценки качества GenAI (Ragas, TruLens, LLM-as-a-judge);
- понимание базовых принципов CI/CD, MLOps (например, MLflow) и знание Kubernetes (K8S);
- наличие IT-сертификатов, профильных публикаций или опыта обучения за рубежом;
- навыки презентации данных и сторителлинга.