AI-engineer

AI-engineer

Москва, Летниковская улица, 10с4

Метро: Добрынинская

Описание вакансии

Обязанности:
  • Проектировать и разрабатывать RAG-пайплайны (Retrieval-Augmented Generation) для задач question-answering, поиска и суммаризации документов
  • Интегрировать LLM (локальные модели) с использованием фреймворков (LangChain)
  • Работать с векторными базами данных для эффективного хранения и поиска эмбеддингов
  • Проводить оценку качества RAG-систем: применять метрики, разрабатывать собственные тестовые сценарии
  • Внедрять мониторинг и observability для LLM-приложений с помощью LangFuse (отслеживание промптов, трассировка, анализ стоимости и задержек)
  • Обеспечивать безопасность LLM-систем: внедрять практики LLMSecOps (защита от prompt injection, санитизация входных данных, контроль доступа к моделям, аудит логов)
  • Разрабатывать и поддерживать классические ML-модели для задач классификации, регрессии, кластеризации — встраивать их в продуктовую архитектуру
  • Оптимизировать производительность инференса моделей
Требования:
  • Опыт разработки на Python от 3 лет
  • Знание асинхронного программирования (asyncio/aiohttp) будет плюсом
  • Глубокое понимание принципов работы LLM, трансформеров, эмбеддингов, методов промпт-инжиниринга
  • LLM в проде: понимание токенизации/контекста и ограничений, типовых failure-modes; понимание, когда уместна адаптация модели (PEFT/LoRA/QLoRA) и как оценивать влияние на качество/производительность.
  • RAG / knowledge Q&A: практический опыт построения решений на базе корпоративных данных: эмбеддинги, retrieval (векторный/гибридный), reranking, grounding/цитирование, контроль качества.
  • Инструменты LLM: HuggingFace + LangChain/LlamaIndex (или аналоги); опыт построения agentic/non-agentic пайплайнов с tool/function calling (контракты инструментов, устойчивость вызовов).
  • Backend и интеграции: сильный Python; сервисы и API (FastAPI или аналоги), очереди/воркеры/фоновые задачи, интеграции с внутренними системами; тесты и сопровождение.
  • Production/observability: логи/метрики/трейсы (Grafana/Prometheus или аналоги), диагностика инцидентов и деградаций качества/производительности.
  • Инфраструктура: Linux/CLI; Kubernetes на уровне чтения манифестов/логов и участия в диагностике.
Условия:
  • Оформление по ТК, белая заработная плата
  • Оплачиваем питание в офисе
  • ДМС, страховка жизни и несчастных случаев, страховка от онкозаболеваний
  • Ежегодная индексация оклада
  • Годовая премия 10% от годового оклада
  • Софинансирование фитнеса
  • Корпоративные курсы английского языка
  • Оплата обучения до 100 000 р в год
Навыки
  • Python
  • MCP
  • Claude
  • LLM
  • RAG
  • PostgreSQL
  • Docker
  • FastAPI
  • Scikit-learn
  • CatBoost
Посмотреть контакты работодателя

Адрес

Похожие вакансии

evrone.ru
  • Москва

  • Не указана

Рекомендуем
СП Солюшен
  • Москва

  • Не указана

Рекомендуем
SDI Research

Senior ML/AI Engineer

SDI Research

  • Москва

  • Не указана

Рекомендуем
ФосАгро

AI Engineer

ФосАгро

  • Москва

  • Не указана

  • Москва

  • до 7000 USD

Ингосстрах
  • Москва

  • до 7000 USD

Aiti Guru

AI-инженер

Aiti Guru

  • Москва

  • до 7000 USD

Банк ПСБ
  • Москва

  • до 7000 USD

Манн-Рудницкая Екатерина Геннадьевна

AI Engineer / Специалист по AI‑агентам / Инженер промптов

Манн-Рудницкая Екатерина Геннадьевна

  • Москва

  • до 150000 RUR

Voximplant
  • Москва

  • до 150000 RUR

Лаборатория Касперского

Senior AI Engineer

Лаборатория Касперского

  • Москва

  • до 150000 RUR

Точка Банк

AI-инженер

Точка Банк

  • Москва

  • до 320000 RUR

FIRST DATA LLC

AI инженер

FIRST DATA LLC

  • Москва

  • до 320000 RUR

  • Москва

  • от 250000 RUR

Национальная система платежных карт

Ведущий разработчик / AI Engineer (RAG / LLM)

Национальная система платежных карт

  • Москва

  • от 250000 RUR

Брайт Эйдженси

AI Engineering Manager

Брайт Эйдженси

  • Москва

  • от 250000 RUR

  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию