Мы развиваем прикладные решения на базе больших языковых моделей (LLM): умные базы знаний, корпоративные AI-ассистенты, инструменты работы с нормативной и технической документацией, аналитикой и заявками. Работаем с корпоративными клиентами и госзаказчиками.
В команду ищем опытного ML-инженера, который усилит нас в части проектирования и оптимизации RAG-решений. Задачи — от инженерных до архитектурных.
Ключевые задачи:
Проектирование и реализация RAG-пайплайнов с нуля или оптимизация текущих (Haystack, LangChain, LlamaIndex)
Подключение и обработка различных источников данных (документы, базы знаний, BI-данные)
Настройка векторного поиска (FAISS, Weaviate, Elasticsearch, hybrid search)
Интеграция с LLM (OpenAI, Mistral, LLaMA и др.)
Разработка компонентов препроцессинга: chunking, фильтрация, аннотирование, структурирование
Технический аудит и консультации по архитектуре RAG-систем
Взаимодействие с разработчиками и аналитиками
Требования:
Глубокая экспертиза в ML/NLP и опыте работы с LLM-пайплайнами
Практический опыт построения RAG-архитектур: retriever + generator, hybrid search
Знание современных инструментов: Haystack, LangChain, LlamaIndex, HuggingFace
Отличное знание Python, опыт с FastAPI, git
Понимание особенностей векторного поиска, embedding-моделей, retrieval evaluation
Способность быстро разбираться в чужом коде и выстраивать системные решения
Будет плюсом:
Опыт продакшн-разработки LLM-продуктов
Навыки работы с Docker, MLFlow, DVC
Знание особенностей работы с нормативной документацией
Опыт код-ревью и менторства
Что предлагаем:
Гибкий формат: part-time, удалёнка, чёткие задачи
Работа с востребованными LLM-технологиями и реальными кейсами
Возможность влиять на архитектуру решений
Быстрая и технологичная команда без лишних процессов
Оплата по договорённости: ставка или по проектам
Если ты хорошо понимаешь, как работает RAG, и хочешь применять это на практике в живых проектах — будем рады обсудить сотрудничество.