Спроектировать и собрать прототип оффлайн RAG для корпуса школьных учебников.
•
Организовать пайплайн данных: конвертация (PDF/DOCX → текст)(опционально),
очистка(опционально), предобработка, чанкинг.
•
Выбрать и настроить векторное хранилище (например, ChromaDB / FAISS / Qdrant /
Weaviate).
•
Подобрать модель эмбеддингов и построить ретривер; при необходимости —
добавить переранжирование.
•
Интегрировать локальную LLM в формате .gguf (через llama.cpp / llama‑cpp‑python) в
цепочку: запрос → поиск → формирование промпта → генерация ответа.
•
Определить и измерять метрики: точность/полнота поиска (Precision/Recall@k, MRR),
релевантность ответов, доля галлюцинаций.
•
Исследовать целесообразность fine‑tuning (LoRA/QLoRA); при подтверждении пользы
— запустить контролируемые эксперименты.
•
Подготовить документацию и инструкции по развёртыванию, обновлению и
эксплуатации.