Prompt-инженер

Москва, Ленинградский проспект, 15с14

Метро: Белорусская

Описание вакансии

Рувики - новая интернет-энциклопедия.

Наш продукт – Онлайн-энциклопедия, предоставляющая доступ к миллионам статей, изображений и видеороликов по самым различным темам - от истории и науки до искусства и технологий.

О проекте:

Мы развиваем инструменты и сервисы для автоматизации написания, проверки и обогащения статей в Рувики. Используем искусственный интеллект и большие языковые модели (LLM), чтобы повысить эффективность работы авторов и редакторов.

Обязанности:

Проектирование и улучшение промптов для классификации, генерации, суммаризации, верификации и LLM-судей.
Разработка тест-кейсов для типовых, сложных и граничных сценариев.
Анализ FP/FN, ошибок разметки, галлюцинаций, форматных сбоев и prompt injection.
Сбор и поддержка golden datasets и regression-наборов.
Проверка structured output: JSON/schema, обязательные поля, стабильность формата.
Документирование дефектов и передача спорных кейсов аналитику, редактору или разработчику.
Базовые batch-проверки через Python/таблицы и анализ логов через SQL

Требования:

Практический опыт работы с LLM в задачах, где важны качество, факты и воспроизводимость результата;
Умение проектировать промпты для классификации, суммаризации, генерации, проверки фактов и сравнения результатов;
Понимание QA-подхода к LLM: тест-кейсы, golden datasets, регрессионные прогоны, сравнение версий промптов и моделей;
Умение анализировать ошибки LLM-пайплайна: FP/FN, спорная разметка, галлюцинации, prompt injection, ошибки формата, дат и чисел;
Понимание задач кластеризации и дедупликации на уровне логики: отличать похожую тему от того же события;
Опыт или готовность работать с verifier / LLM judge-подходом, где модель проверяет, сравнивает или маршрутизирует результат;
Навык grounded generation: генерация только по входным данным, без внешних фактов и неподтверждённых утверждений;
Умение работать со structured output: JSON, обязательные поля, допустимые значения, проверка стабильности формата;
Базовые знания Python или уверенная работа с таблицами для batch-прогонов, расчёта метрик и анализа ошибок;
Базовый SQL для анализа логов, промежуточных результатов и качества пайплайна;
Умение понятно оформлять выводы: что чинить промптом, что проверкой/guard-ом, что выносить на аналитика, редакцию или разработку;
Отличная письменная грамотность, внимательность к фактам, датам, числам, формулировкам и источникам;
Английский не ниже Intermediate для работы с документацией моделей, API и инструментов.

Будет плюсом:

Опыт с новостными, энциклопедическими, редакционными или фактологически строгими продуктами;
Опыт с LLM evals, golden sets, regression-наборами и сравнением качества промптов/моделей;
Опыт с RAG, embeddings, semantic search, кластеризацией, дедупликацией или LLM judge;
Опыт анализа разметки: поиск ошибок в labels, описание policy conflicts, подготовка спорных кейсов для аналитика/редакции;
Навыки работы с Git, Docker, REST API, облачными сервисами;
Опыт сбора и систематизации обратной связи от редакторов, аналитиков или пользователей.

Условия:

Уровень дохода обсуждается с финальным кандидатом по итогам собеседования.
Интересные задачи, крутые кейсы, возможность выйти на новый профессиональный уровень.
100% «белая» заработная плата, официальное трудоустройство по ТК РФ с первого дня.
Полная занятость, удаленный формат работы
Пятидневная рабочая неделя, с пн-пт.
Дружный и неравнодушный коллектив профессионалов.
Программа ДМС после успешного прохождения испытательного срока.