Наша команда создаёт внутренний сервис, который позволяет другим командам быстро запускать умные продукты на базе больших языковых моделей (LLM) и собственных данных. Мы строим платформу RAG (Retrieval-Augmented Generation), чтобы избавить разработчиков в компании от необходимости глубоко погружаться в тонкости векторизации, семантического поиска и общения с LLM, предоставив им готовый и удобный API.
Что у нас есть сейчас и над чем мы работаем:
Пайплайны для обработки данных: Разрабатываем и поддерживаем конвейеры для загрузки и подготовки документов из разных источников (Confluence, Jira, общие диски, почтовые архивы). Данные всегда «грязные», поэтому очистка и структуризация — наша постоянная головная боль и точка роста.
Сервис векторизации и поиска: Мы развернули и адаптируем векторную базу данных и строим вокруг неё API. Сейчас экспериментируем с гибридным поиском (ключевые слова + семантика), чтобы находить не только похожие по смыслу, но и точные совпадения.
Оркестрация RAG-цепочек: Основной наш продукт — это API, который принимает вопрос пользователя, находит релевантные фрагменты текста из нашей базы, конструирует «умный» промпт и отправляет его в LLM (используем несколько моделей, от opensource до коммерческих).
Инструменты для оценки: Качество — ключевая проблема RAG. Мы создаём внутренние дашборды и инструменты для оценки релевантности найденных документов и адекватности финальных ответов, собираем фидбэк от первых пользователей.
Мы ищем инженера, которому интересно не только исследовать новые подходы в NLP и Information Retrieval, но и доводить их до стабильно работающего в продакшене сервиса, которым пользуются реальные люди. Наш стек — это Java\Scala(LangChain), Python только для RND (FastAPI, LangChain/LlamaIndex), Docker, Kubernetes, и много экспериментов с векторными базами и ML-моделями. Если вы готовы строить промышленный RAG с нуля, а не просто использовать готовые решения, — нам по пути.
· участие в разработке приложения с использованием Spring & LLM
· написание unit-тестов
· выполнение CodeReview. Формирование правил кодирования в команде
· интеграция с различными хранилищами данных: Clickhouse, PostgreSQL, Hadoop.
AI-компетенции: навыки AI-промптинг (one-zeroshot, few-shot), опыт работы с MCP, RAG и опыт использования co-pilot при разработке приложений.
Деловые Решения и Технологии (ДРТ)
Москва
Не указана
Москва
до 400000 RUR