AI Engineer – RAG / Knowledge Graph / Local LLM

AI Engineer – RAG / Knowledge Graph / Local LLM

Москва, Западный административный округ, Можайский район, Инновационный центр Сколково, Большой бульвар, 42с1

Метро: Баковка

Описание вакансии

О нас

LumosIT - пять лет на рынке IT-разработки для бизнеса, резидент Технопарка Сколково, резидент Московского Инновационного Кластера, патенты на изобретения в области передовых методов AI.

Строим корпоративные AI-системы для B2B: от строительства и производства до банков и логистики. Ядро нового продукта - интеллектуальные базы знаний, которые отвечают на основе внутренней документации компании без галлюцинаций и с трассировкой до источника. Заказов становится больше, проекты идут параллельно, поэтому расширяем команду инженером, для которого RAG это основная специализация.

Чем предстоит заниматься

  • Проектировать и строить RAG-пайплайны под нестандартные источники: транскрипты, живая речь, методологические материалы

  • Строить Knowledge Graph поверх векторной базы - типология связей, смысловые цепочки, интеграция с retrieval в лучших традициях Карпати

  • Разворачивать LLM семейства Qwen локально, настраивать OpenAI-совместимый API поверх

  • Работать с Qdrant: payload-фильтрация, гибридный поиск, мультиарендная архитектура

Задачи повторяются от проекта к проекту, устойчивый поток работы.

Требования

Опыт в Python и ML от 5-6 лет. С RAG-системами от 2-3 лет - с того момента, когда это стало актуальной инженерной задачей.

  • Гибридный поиск (dense + sparse/BM25) - строил, понимаешь ограничения семантики

  • Qdrant или аналог (Weaviate, Milvus) - работал в продакшне, не на пет-проектах

  • Knowledge Graph - ребра с типологией, граф-обход, связка с векторным поиском

  • Локальный деплой: llama.cpp, vLLM или Ollama, квантизация, CUDA

  • LangGraph или LangChain - многошаговые агенты с состоянием, обработка ошибок, retry

  • Русскоязычные данные - знаешь специфику токенизации, умеешь выбирать embedding-модель под задачу

Стек: Python 3.10+, FastAPI, asyncio · LangGraph · Qdrant + pgvector · PostgreSQL / SQLAlchemy async · sentence-transformers, multilingual-e5-large · NetworkX · llama.cpp / vLLM · Docker, Linux · Git

Плюсом: опыт с RAGAS / DeepEval, Neo4j, неструктурированными источниками, LoRA fine-tuning на RU-данных.

Условия

Работа удаленная. При желании - рабочее место в Технопарке Сколково.

Работа напрямую с основателем компании без лишних звеньев.

Договор с самозанятым или ИП. Оформление по ТК обсуждается.

Зарплата: 180 000 - 260 000 руб., финальная цифра по итогам разговора.

Вводный период 1-2 недели, оплачивается. Небольшое тестовое задание на 1-2 часа на этапе отбора.

Навыки
  • Python
  • GitHub
  • MLflow
  • Linux
  • PostgreSQL
  • Docker
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Газпромбанк
  • Москва

  • Не указана

Рекомендуем
Bell Integrator

AI/LLM инженер

Bell Integrator

  • Москва

  • Не указана

Рекомендуем
ГКУ Инфогород

ML-инженер

ГКУ Инфогород

  • Москва

  • Не указана

Рекомендуем
ТехВилл
  • Москва

  • до 300000 RUR

ГК Орбита

AI Data Analyst

ГК Орбита

  • Москва

  • до 300000 RUR

Social Media Holding
  • Москва

  • до 300000 RUR

Т1
  • Москва

  • до 300000 RUR

Napoleon IT
  • Москва

  • до 300000 RUR

Агропромцифра

Data Engineer

Агропромцифра

  • Москва

  • до 300000 RUR

«UZUM TECHNOLOGIES»
  • Москва

  • до 300000 RUR

ЛАНИТ
  • Москва

  • до 300000 RUR

ТМГТ

Lead ML Engineer

ТМГТ

  • Москва

  • до 300000 RUR

LLM/RAG/AI Engineer (GigaChat Enterprise)

Салют для Бизнеса

  • Москва

  • до 300000 RUR

СОГАЗ

RAG-инженер

СОГАЗ

  • Москва

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию