LLM/RAG/AI Engineer

LLM/RAG/AI Engineer

Описание вакансии

Обязанности:

  • Проектировать и разрабатывать RAG-пайплайны: chunking, embedding, retrieval, reranking, generation
  • Подбирать стратегии обработки и разбиения документов под разные типы контента (recursive, semantic, document-aware chunking)
  • Работать с разными форматами данных: PDF, DOCX, XLSX, изображения, документы без текстового слоя
  • Настраивать и оптимизировать векторный и гибридный поиск
  • Проектировать flow с логикой вызовов: роутинг, условные переходы, цепочки промптов
  • Разрабатывать агентные системы с использованием инструментов и многошаговым планированием
  • Интегрировать внешние модели: embedding-модели, rerankers, классификаторы, vision-модели
  • Оценивать качество систем: настраивать retrieval-метрики (hit rate, MRR, NDCG), проводить оценку генерации (RAGAS, faithfulness, relevancy)
  • Контейнеризировать и деплоить решения на on-prem инфраструктуру

Требования

  • Опыт работы от 3х лет
  • Опыт работы с AI инструментами: от года
  • Опыт создания RAG-систем
  • Понимание архитектуры LLM: принципы работы трансформеров, управление контекстным окном, ограничения по токенам, стратегии работы с длинным контекстом (chunking, map-reduce, refine), узкие места inference
  • Знание NLP: токенизация, эмбеддинги, работа с текстом на разных языках
  • LangChain, LlamaIndex
  • LLM-инференс: OpenAI API, GigaChat API, vLLM, Ollama
  • Векторные БД: FAISS, Qdrant, Milvus, Chroma, Weaviate, Elasticsearch
  • Hybrid search: BM25 + dense retrieval, reciprocal rank fusion
  • Embedding-модели: e5, bge, multilingual-e5
  • Python, Git, Docker, docker-compose
  • PostgreSQL, Redis
  • Методы оценки: hit rate, RAGAS, human evaluation
  • Способность объяснить принятые технические решения и их trade-offs

Условия

  • достойная заработная плата + годовой бонус
  • сильная команда
  • ДМС, с первого рабочего дня

Посмотреть контакты работодателя

Похожие вакансии

evrone.ru
  • Москва

  • до 360000 RUR

Рекомендуем
СП Солюшен
  • Москва

  • до 360000 RUR

Рекомендуем
Тесла Телекоммуникации
  • Москва

  • до 360000 RUR

Рекомендуем

AI Engineer

Артсофт-Технологии

  • Москва

  • до 360000 RUR

LionAdverts
  • Москва

  • от 3000 USD

SDI Research

Senior ML/AI Engineer

SDI Research

  • Москва

  • от 3000 USD

Progressive Mind
  • Москва

  • до 6000 USD

SkillCampVR
  • Москва

  • до 6000 USD

ArtVolkov.ru
  • Москва

  • до 380000 RUR

  • Москва

  • до 7000 USD

NM Technologies HK Limited
  • Москва

  • до 350000 RUR

Gradient
  • Москва

  • от 450000 RUR

Деньги Вперед

SRE-инженер

Деньги Вперед

  • Москва

  • до 350000 RUR

  • Москва

  • от 250000 RUR

Swordfish Security

AppSec инженер (Wave)

Swordfish Security

  • Москва

  • от 250000 RUR

Avanpost
  • Москва

  • от 250000 RUR

  • Москва

  • от 400000 RUR

МФК Фордевинд
  • Москва

  • до 350000 RUR

РДП Энтерпрайз

Senior DevOps-инженер

РДП Энтерпрайз

  • Москва

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию