Информационная группа «Интерфакс» - компания с 30 – летней историей, лидер российского информационного рынка в сегменте В2В.
Кроме того, что мы информационное агентство #1 в России, мы еще и крупная IT-компания с несколькими центрами программных разработок, расположенными в Москве и регионах.
Мы разрабатываем ИТ решения, которые помогают компаниям работать на финансовом и товарном рынках, принимать инвестиционные решения, управлять рисками, организовывать внешние коммуникации.
Наши флагманские продукты - это такие системные решения, как
СПАРК, SCAN, МАРКЕР, X – Compliance и другие.
В данный момент вакансия LLM Engineer открыта в Новом Департаменте и создается направление в разработке ИИ агентов.
Описание проекта:
-
Мы создаем ИИ ассистента на базе LLM для нового продукта на рынке;
-
ИИ ассистент будет помогать нашим клиентам с анализом информации и выработки правильных управленческих решений, а в последующем и возьмет на себя функции автоматизации;
-
Одна из функции это обработка документов (PDF, сканов, DOCX и др.) для последующей работы с ними в рамках сценариев ИИ ассистента – получение ответов по содержанию текстов, выделение ключевых обстоятельств, суммаризация и так далее.
Роль:
-
Нужен инженер, который спроектирует и реализует сервис на базе NLP & RAG: от ingestion сырых документов до готовых индексов и фичей для LLM‑ассистента;
-
Разработка сервисов обработки PDF и других форматов документов, нормализации , поиска, извлечения атрибутов и сущностей.
Основные задачи:
-
Проектирование и разработка пайплайна обработки документов: загрузка сырых PDF/сканов, конвертация (OCR), извлечение текста и метаданных, очистка и нормализация;
-
Разметка и структурирование документов: выделение реквизитов, дат, номеров и других атрибутов и сущностей;
-
Построение offline и online обработки, в т.ч. RAG‑архитектуры: разбиение документов на чанки, генерация эмбеддингов, построение векторных индексов, настройка поиска, тематическая саммаризация.
Требования к кандидату:
-
Опыт промышленной разработки на Python от 4–6 лет;
-
Уверенный опыт разработки backend‑сервисов, в т.ч. на FastAPI;
-
Опыт реализации пайплайнов обработки текстовых документов (желательно — юридических, финансовых или комплаенс);
-
Понимание и практический опыт построения RAG‑систем: векторный и гибридный поиск, индексация, работа с эмбеддингами, кастомизация и дообучение BERT;
-
Опыт работы с LangChain/LangGraph или аналогичными фреймворками, а также разработка оркестрации LLM‑агентов;
-
Опыт работы с векторными БД: Milvus, Qdrant, pgvector, Faiss;
-
Опыт интеграции с LLM API (OpenAI, Anthropic, локальные модели и пр.), глубокое понимание prompt‑инженеринга;
-
Опыт разработки и интеграции RESTful API, знание Docker, CI/CD, понимание требований к безопасности и масштабируемости в enterprise‑среде.
Будет плюсом:
-
Опыт работы с популярными ML-фреймворками: TensorFlow, PyTorch, Scikit-learn, XGBoost и т.д.;
-
Опыт настройки OCR и извлечения текста из «грязных» PDF и сканов (Tesseract, Azure/AWS/GCP Vision и т.п.);
-
Понимание MLOps‑подходов и опыта деплоя self‑hosted LLM (Llama, Mistral и др.);
-
Опыт использования и дообучения современных NLP‑моделей под задачи NER, классификации документов, извлечения сущностей.
Мы предлагаем:
-
Официальное оформление по ТКРФ;
-
Расширенное ДМС со стоматологией/ корпоративные скидки;
-
Офис в историческом центре Москвы (Маяковская, 1 мин. ходьбы от метро);
-
Гибридный график работы;
-
Возможности профессионального роста и развития;
-
Участие в интересных проектах с использованием современных технологий;
-
Дружелюбную атмосферу и поддержку коллег.
-
Если вы страстны к разработке, любите разбираться в сложных системах и хотите стать частью инновационной команды — присылайте свое резюме!