Мы ищем AI/ML Engineer уровня Middle для разработки и внедрения решений на основе Generative AI в fintech-среде. Вы будете создавать RAG-системы, интегрировать LLM, разрабатывать AI-агентов и выводить модели в промышленную эксплуатацию.
Основная цель — разработка масштабируемых AI-сервисов, которые решают реальные бизнес-задачи: персонализация ответов клиентам, обработка документов, автоматизация сценариев поддержки и др.
Роль предполагает тесное взаимодействие с AI специалистами и смежными командами из ИТ. Это шанс работать с передовыми GenAI-технологиями, где AI-агенты, RAG и multi-agent системы дают конкурентное преимущество в финтех-индустрии.
Разработка RAG-систем: Проектирование и сборка пайплайнов для обработки документов (парсинг, чанкинг, векторизация), реализация гибридного поиска и механизмов реранжирования для повышения точности ответов.
* Интеграция LLM и создание агентов: Разработка AI-ассистентов и чат-ботов с использованием LangChain / LangGraph, реализация сложных multi-agent сценариев с распределением задач между агентами.
* Дообучение и адаптация моделей: Проведение экспериментов по дообучению открытых LLM (Qwen, Llama, Mistral) с использованием PEFT (LoRA/QLoRA) для улучшения качества инференса на специфических fintech-данных.
* Инженерия промптов и оптимизация: Разработка эффективных шаблонов промптов, внедрение техник (Few-shot, Chain-of-Thought) и оптимизация контекстного окна для работы с большими объемами данных.
* Разработка API: Создание микросервисов на FastAPI для инференса моделей, обеспечение асинхронной обработки запросов и интеграция с системой очередей (RabbitMQ/Kafka) для отказоустойчивости.
* DevOps и MLOps: Контейнеризация сервисов (Docker), развертывание моделей на GPU-инфраструктуре (Ollama, vLLM), настройка мониторинга дрейфа данных и качества ответов в продакшене.
* Исследования и R&D: Анализ научных статей и реализации SOTA-подходов в области RAG и Agentic AI, проведение тестов для сравнения различных архитектурных гипотез.
* Документирование и архитектурное согласование: Ведение технической документации по архитектуре AI-сервисов, описание API-контрактов и результатов экспериментов для кросс-командного взаимодействия. Подготовка пакетов документов по ИИ продукту для Архитектурного комитета и отрисовка схем взаимодействия сервисов для ИБ.
* Определение и расчет необходимой инфраструктуры (GPU, CPU, RAM, хранилища) для разрабатываемых AI-решений с учетом планируемой нагрузки и требований к отказоустойчивости