Москва
Метро: Библиотека им.Ленина
Команда Production IT растет и развивается.
Мы в поисках новых направлений и никогда не стоим на месте, поэтому нам в команду необходим вдумчивый и ответственный профессионал. Мы развиваем банковское приложение (техподдержка и AI-ассистент) и HR-систему с элементами интеллектуальной обработки документов. В фокусе — построение production-ready AI-решений: от LLM-ассистента на базе RAG до CV/NLP-моделей для анализа документов.
Обязанности:
Реализация и поддержка RAG-пайплайна для AI-ассистента банковского приложения
Подготовка и структурирование .md документации для индексации
Подбор и тестирование LLM (Qwen, Llama, Solar, Saiga и др.) под разные бизнес-кейсы
Оптимизация по:
потреблению памяти
скорости инференса
качеству решения узкоспециализированных задач
Prompt engineering, переформулирование запросов
Построение дашбордов в Grafana
Работа с InfluxDB
Метрики качества и производительности моделей
Работа с LangGraph (state + nodes)
Логирование и трейсинг через LangSmith
Реализация ML API на FastAPI
Structured output от LLM
Работа с Redis Streams
Разворачивание моделей (CPU / GPU, vLLM)
Контейнеризация через Docker-compose
Обучение модели детекции layout документов (0.85 mAP)
Обучение и тестирование NER
Обучение моделей детекции текста на MMOCR
Работа с ResNet18, YOLOv7
Рефакторинг и переработка API (Django, 3 сервиса)
Оценка качества изображений: шум, размытие, перспектива
Обучение кастомной модели классификации шрифтов и стилей текста
Ожидаем от кандидата
Практический опыт построения RAG-архитектур
Опыт работы с LLM в production
Понимание принципов инференса (GPU/CPU, vLLM)
Уверенный Python (FastAPI / Django)
Опыт обучения CV/NLP моделей
Понимание метрик качества (mAP, F1, precision/recall)
Опыт контейнеризации (Docker)
Опыт построения ML-сервисов с логированием и мониторингом
Будет плюсом:
Опыт работы с банковскими или финтех-проектами
Опыт оптимизации инференса под ограниченные ресурсы
Опыт работы с пайплайнами переобучения
Финфрейм
Москва
до 300000 RUR
Москва
до 300000 RUR