ML / LLM Engineer

Production IT

ML / LLM Engineer

Москва

Метро: Библиотека им.Ленина

Описание вакансии

Команда Production IT растет и развивается.

Мы в поисках новых направлений и никогда не стоим на месте, поэтому нам в команду необходим вдумчивый и ответственный профессионал. Мы развиваем банковское приложение (техподдержка и AI-ассистент) и HR-систему с элементами интеллектуальной обработки документов. В фокусе — построение production-ready AI-решений: от LLM-ассистента на базе RAG до CV/NLP-моделей для анализа документов.

Обязанности:

  • Реализация и поддержка RAG-пайплайна для AI-ассистента банковского приложения

  • Подготовка и структурирование .md документации для индексации

  • Подбор и тестирование LLM (Qwen, Llama, Solar, Saiga и др.) под разные бизнес-кейсы

  • Оптимизация по:

    • потреблению памяти

    • скорости инференса

    • качеству решения узкоспециализированных задач

  • Prompt engineering, переформулирование запросов

  • Построение дашбордов в Grafana

  • Работа с InfluxDB

  • Метрики качества и производительности моделей

  • Работа с LangGraph (state + nodes)

  • Логирование и трейсинг через LangSmith

  • Реализация ML API на FastAPI

  • Structured output от LLM

  • Работа с Redis Streams

  • Разворачивание моделей (CPU / GPU, vLLM)

  • Контейнеризация через Docker-compose

  • Обучение модели детекции layout документов (0.85 mAP)

  • Обучение и тестирование NER

  • Обучение моделей детекции текста на MMOCR

  • Работа с ResNet18, YOLOv7

  • Рефакторинг и переработка API (Django, 3 сервиса)

  • Оценка качества изображений: шум, размытие, перспектива

  • Обучение кастомной модели классификации шрифтов и стилей текста

Ожидаем от кандидата

  • Практический опыт построения RAG-архитектур

  • Опыт работы с LLM в production

  • Понимание принципов инференса (GPU/CPU, vLLM)

  • Уверенный Python (FastAPI / Django)

  • Опыт обучения CV/NLP моделей

  • Понимание метрик качества (mAP, F1, precision/recall)

  • Опыт контейнеризации (Docker)

  • Опыт построения ML-сервисов с логированием и мониторингом

Будет плюсом:

  • Опыт работы с банковскими или финтех-проектами

  • Опыт оптимизации инференса под ограниченные ресурсы

  • Опыт работы с пайплайнами переобучения

Условия:
  • рост ЗП, в зависимости от результатов
  • через полгода возможность взять оплачиваемый отпуск
  • работа как самозанятому или через ИП по договору
  • стандартный график по будням, не считая праздники.
Навыки
  • Python
  • Django Framework
  • Docker
Посмотреть контакты работодателя

Адрес

Похожие вакансии

МФК Фордевинд

Middle/Senior ML-инженер

МФК Фордевинд

  • Москва

  • до 350000 RUR

Рекомендуем
МТС
  • Москва

  • до 300000 RUR

Рекомендуем
Go Invest

LLM инженер

Go Invest

  • Москва

  • до 300000 RUR

Рекомендуем
RWB (Wildberries & Russ)

ML Engineer (AntiDDoS)

RWB (Wildberries & Russ)

  • Москва

  • до 300000 RUR

Солар
  • Москва

  • до 300000 RUR

Amex Development

ML-инженер

Amex Development

  • Москва

  • от 230000 RUR

Онлайн-школа Тетрика

ML Engineer

Онлайн-школа Тетрика

  • Москва

  • от 230000 RUR

Spice IT
  • Москва

  • от 230000 RUR

Супрун Елена Николаевна
  • Москва

  • до 5000 USD

Звук
  • Москва

  • до 5000 USD

Бэнкс Софт Системс

AI/Prompt Engineer в AiLab

Бэнкс Софт Системс

  • Москва

  • до 5000 USD

HeadHunter
  • Москва

  • до 5000 USD

Интернет-энциклопедия РУВИКИ

ML/DS инженер (рекомендательная система)

Интернет-энциклопедия РУВИКИ

  • Москва

  • до 5000 USD

Okko
  • Москва

  • до 5000 USD

ГКУ Инфогород

ML-инженер

ГКУ Инфогород

  • Москва

  • до 5000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию