ML/LLM-инженер

Газпромнефть-Снабжение

ML/LLM-инженер

Санкт-Петербург, переулок Гривцова, 4

Метро: Адмиралтейская

Описание вакансии

Наша команда развивает ИИ-решения для автоматизации закупочных процессов: обработки заявок, коммерческих предложений, технических предложений, договоров, спецификаций, протоколов и сопутствующих документов. Ищем ML/LLM - инженера с практическим опытом в generative AI, который умеет быстро запускать и проверять модели, собирать прототипы и демо, а затем встраивать удачные решения в рабочие сервисы.

Обязанности:

Разработка ML/LLM-компонентов для закупочных процессов

  • Разработка пайплайнов OCR/LLM-извлечения данных из PDF, DOCX, XLSX, сканов, писем и вложений.

  • Формирование черновиков аналитических записок, протоколов сравнения, обоснований и итоговых материалов.

  • Интеграция ML-компонентов в backend-сервисы через API.

Прототипирование и запуск open-source моделей

  • Запуск и адаптация моделей с GitHub, Hugging Face и других open-source источников.

  • Создание рабочих ML/AI-прототипов и демо-стендов в короткие сроки.

  • Проверка применимости новых моделей и подходов на реальных данных.

  • Адаптация research/demo-кода под практические задачи.

  • Создание демо-интерфейсов для бизнеса и внутренних пользователей.

LLM, RAG и structured output

  • Построение RAG/hybrid search по договорам, закупкам, КП, технической документации и справочникам.
  • Разработка retrieval-логики, embeddings, rerank, chunking-стратегий и фильтрации по метаданным.

  • Реализация structured output через LLM: JSON Schema, pydantic-схемы, function calling / tool calling.

  • Валидация, нормализация и постобработка ответов модели.

  • Настройка confidence score и правил обработки ошибок.

  • Снижение галлюцинаций, невалидных JSON-ответов и неполных структурированных результатов.

Backend и frontend

  • Разработка backend-сервисов и frontend на Python (с Streamlit и Gradio)
  • Реализация REST API и асинхронных пайплайнов обработки задач.
  • Работа с FastAPI, pydantic, async/sync API.
  • Работа с очередями и брокерами сообщений: Celery, Kafka, RabbitMQ или аналогами.
  • Интеграция ML/LLM-компонентов с поиском, базами данных, файловыми хранилищами и пользовательскими интерфейсами

Evaluation и контроль качества

  • Разработка метрик качества ML/LLM-модулей и пайплайнов разметки/валидации.

  • Оценка качества классификации (accuracy, precision, recall, F1), извлечения атрибутов (exact/partial match, полнота схем), RAG (precision, recall, MRR, nDCG, hit rate) и LLM-ответов (фактологичность, полнота, цитирование).

  • Подготовка регрессионных наборов и эталонных примеров.

  • Организация human-in-the-loop разметки и анализа ошибок.

  • Проектирование сценариев, где модель предлагает результат, пользователь подтверждает или исправляет, а исправления сохраняются для дальнейшего улучшения системы.

Generative AI и мультимодальные модели

  • Запуск и адаптация генеративных моделей для текста, изображений и мультимодальных сценариев.

  • Подбор моделей под конкретные прикладные задачи: извлечение информации, классификация, визуальный анализ, генерация, сравнение объектов.

Требования:
  • Уверенный навык Python, Streamlit и Gradio.

  • Опыт разработки backend-сервисов на FastAPI или аналогичных фреймворках.

  • Опыт работы с REST API, Docker, конфигурациями, секретами и CI/CD.

  • Умение писать код, который можно сопровождать, отлаживать, тестировать и передавать.

  • Опыт работы с очередями и асинхронной обработкой задач будет преимуществом.

  • Желательно понимание async/sync API, pydantic, типизации, тестирования, логирования и обработки ошибок.

LLM/RAG-практика

  • Практический опыт разработки RAG-систем, понимание embeddings, rerank, chunking, hybrid search, grounding, prompt engineering.

  • Опыт работы с tool calling / function calling и многошаговыми LLM-пайплайнами.

  • Опыт получения structured output от LLM.

  • Практика работы с JSON Schema, pydantic-моделями, structured output и валидацией результатов.

  • Понимание типовых проблем LLM: галлюцинации, потеря контекста, невалидный JSON, неполные ответы, нестабильность результата.

  • Умение оценивать качество LLM/RAG-пайплайнов не только визуально, но и через метрики и тестовые наборы.

Быстрый запуск моделей и generative AI

  • Практический опыт запуска open-source моделей с GitHub и Hugging Face, работа с PyTorch и Hugging Face Transformers, умение быстро разобраться с чужим research/demo-кодом.

  • Понимание зависимостей ML-проектов, окружений, CUDA, GPU-инференса и типовых проблем запуска моделей; опыт создания быстрых демо на Gradio, Streamlit, FastAPI или аналогичных инструментах.

  • Опыт работы с генеративными моделями — важное преимущество.

  • Опыт с Stable Diffusion, SDXL, ControlNet, LoRA или аналогичными image generation подходами — преимущество.

  • Понимание VQA, vision-language models и мультимодальных сценариев — преимущество.

Поиск и базы данных

  • Опыт работы с OpenSearch, Elasticsearch, PostgreSQL или аналогичными системами.

  • Понимание полнотекстового, векторного и гибридного поиска; индексов, фильтров, справочников и метаданных.

  • Опыт построения поиска по документам, чанкам, атрибутам и структурированным данным; trade-off между качеством поиска, скоростью, памятью и стоимостью индексации.

  • Опыт работы с SQL и базовыми схемами хранения данных.

ML evaluation

  • Умение считать качество ML/LLM-компонентов.

  • Понимание accuracy, precision, recall, F1 для классификации, precision/recall для извлечения сущностей и атрибутов, использование exact match и partial match для оценки структурированного извлечения.

  • Оценка качества RAG-ответов: релевантность источников, фактологичность, полнота, корректность цитирования.

  • Умение готовить тестовые выборки, эталонные примеры и регрессионные наборы.

  • Понимание human-in-the-loop подхода к разметке, исправлению и улучшению качества.

Информационное извлечение

  • Опыт NER, классификации и нормализации сущностей; извлечение закупочных атрибутов (наименование МТР, количество, единицы, сроки, цена, валюта, технические параметры) и сопоставление со справочниками.

  • Нормализация единиц, валют, дат, чисел и текстовых характеристик; правила валидации и проверки полноты данных.

  • Понимание выбора подхода: классические алгоритмы, ML-классификация или LLM для разных задач..

Условия:
  • Оформление по договору ГПХ , срочный договор до конца 2026 с возможностью продления по результатам.

  • Гибкий формат работы.

  • Конкурентная проектная ставка, прозрачная система приёмки этапов.

  • Доступ к корпоративным ресурсам, современному стеку и техническому менторству.

  • Возможность перехода на постоянную основу по итогам проекта.

Навыки
  • Python
  • FastAPI
  • PostgreSQL
  • REST API
Посмотреть контакты работодателя

Адрес

Похожие вакансии

NeoFamily
  • Санкт-Петербург

  • от 120000 RUR

Рекомендуем
Доктор Веб
  • Санкт-Петербург

  • от 120000 RUR

Рекомендуем
Альтами
  • Санкт-Петербург

  • от 120000 RUR

Рекомендуем
Газпромнефть-Снабжение
  • Санкт-Петербург

  • от 120000 RUR

Детский центр Шамиля Ахмадуллина

Промт-инженер (Prompt Engineer) LLM инженер / AI инженер

Детский центр Шамиля Ахмадуллина

  • Санкт-Петербург

  • от 120000 RUR

Т-Банк

ML-инженер

Т-Банк

  • Санкт-Петербург

  • от 120000 RUR

Группа Илим
  • Санкт-Петербург

  • от 120000 RUR

Aston

ML Engineer

Aston

  • Санкт-Петербург

  • от 120000 RUR

СБЕР
  • Санкт-Петербург

  • от 120000 RUR

Aston
  • Санкт-Петербург

  • от 120000 RUR

Аквилон

ML Engineer (NLP/LLM)

Аквилон

  • Санкт-Петербург

  • от 120000 RUR

Ред Софт
  • Санкт-Петербург

  • от 120000 RUR

Группа RBI

ML Инженер

Группа RBI

  • Санкт-Петербург

  • от 120000 RUR

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

Middle ML Engineer

СПб ГКУ Санкт-Петербургский информационно-аналитический центр

  • Санкт-Петербург

  • от 120000 RUR

А-Риал
  • Санкт-Петербург

  • от 200000 RUR

БИОКАД, биотехнологическая компания

Разработчик машинного обучения (ML, LLM)

БИОКАД, биотехнологическая компания

  • Санкт-Петербург

  • от 200000 RUR

Концерн Энерготехнологии

Системный Архитектор AI/ML

Концерн Энерготехнологии

  • Санкт-Петербург

  • от 200000 RUR

  • Санкт-Петербург

  • от 200000 RUR

Haulmont
  • Санкт-Петербург

  • от 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию