Ваши задачи:
Разработка и совершенствование AI-агента на основе архитектуры RAG - от логики взаимодействия до интеграции с данными;
Улучшение качества ответов и точность извлечения информации;
Работа с векторными базами данных (Qdrant) и реляционными хранилищами (PostgreSQL);
Создание продуманных асинхронных API и механизмов обмена данными с помощью FastAPI, websockets и asyncio;
Интегрирование локальных LLM-модели (например, Qwen3) под конкретные задачи продукта;
Настройка и оптимизация деплой моделей через vLLM, обеспечивая высокую производительность и стабильность;
Поддержка CI/CD-процессов (Docker, GitLab);
Анализ результатов и постоянное улучшение качества RAG-системы.
Наши пожелания к кандидатам:
Отличное понимание архитектуры и принципов RAG (Retrieval-Augmented Generation);
Опыт работы с фремйворками и библиотеками: LangGraph, FastAPI, SQLAlchemy, Pydantic, websockets, asyncio;
Опыт работы с векторными базами данных - желательно Qdrant;
Навыки работы с реляционными базами: PostgreSQL или MS SQL;
Опыт разработки и интеграции AI-ассистентов и LLM-решений с использованием локальных моделей (например, Qwen3);
Умение работать с Docker, GitLab.
Наше предложение:
Матчинг Гэлэкси
Москва
до 200000 RUR
Москва
до 200000 RUR
Отраслевой центр разработки и внедрения информационных систем / ОЦРВ
Москва
до 200000 RUR
Москва
до 150000 RUR
Москва
до 420000 RUR