Data Scientist (RAG Systems) — Middle+ / Senior
Направление: LLM / NLP / Information Retrieval
Формат: удалёнка
ЗП: $4000
Технологический стек: Python
Чем предстоит заниматься
• Проектировать и улучшать многоступенчатые RAG-пайплайны: retriever → reranker → generator
• Экспериментировать с чанкингом, эмбеддингами и векторными БД (Weaviate, Qdrant, FAISS) — включая гибридный поиск (BM25 + vector)
• Разрабатывать компоненты retrieval-логики: query rewriting, expansion, decomposition, self-RAG, corrective RAG
Внедрять и тюнить реранкеры (cross-encoders, ColBERT, LLM-based reranking)
• Оценивать качество системы: Recall@K, MRR, NDCG, faithfulness, answer relevance, citation accuracy, A/B-тесты
• Работать с LLM: промпт-инжиниринг, извлечение структурированной информации из документов; при необходимости fine-tuning / LoRA
• Оптимизировать latency и cost: кэширование, квантизация, дистилляция, подбор моделей под задачу
• Строить data pipelines для инжеста, парсинга и обогащения корпуса документов
Мы ожидаем
3+ года практического опыта в NLP/IR и портфолио с RAG/LLM-проектами
Уверенное владение Python
Глубокое понимание информационного поиска: sparse retrieval (BM25), dense retrieval (bi-encoders), гибридные подходы
Опыт с векторными индексами и настройкой поиска (HNSW, IVF, фильтрация по метаданным)
Знание методов оценки качества RAG/NLP-систем (RAGAS, DeepEval, LLM-as-a-judge)
Чтобы мы рассмотрели ваш отклик пришлите краткое описание ваших навыков в указанной сфере в произвольной форме.
Финфрейм
Москва
Не указана
Москва
от 300000 RUR