Промпт-инженер в Яндекс Учебник

Описание вакансии

Мы рассматриваем на частичную занятость от 20 часов в неделю.

Яндекс Учебник запускает AI-репетиторов по разным предметам для 5–11 классов, работающих по российской школьной программе. Мы создаем как чат-боты поверх LLM, так и полноценный продукты: голосовое взаимодействие, адаптирующаяся визуализация, мульти-агентная архитектура, собственные пайплайны оценки качества и итеративная работа с педагогическими гипотезами.
Мы ищем специалиста на стыке промпт‑инжиниринга и педагогического дизайна — того, кто сможет превратить мощные языковые модели в эффективных и понятных цифровых наставников для школьников.

Чем предстоит заниматься?

Проектировать и поддерживать промпты для разнообразных AI-тьюторов в том числе в мультиагентной архитектуре.
Разрабатывать и калибровать LLM-as-a-Judge.
Выстраивать циклы оценки: от golden-датасетов до сравнения моделей и параметров.
Работать с педагогической рамкой: скаффолдинг, теория когнитивной нагрузки, таксономии (DoK, Bloom, SOLO), типология математических ошибок.
Совместно с ML-инженерами проектировать архитектуру агентной системы.
Участвовать в выборе и адаптации бенчмарков и строить собственные русскоязычные оценочные пулы для 5–11 классов.

Что мы ожидаем от вас?

Стек: Python, Claude Sonnet & Opus / Gemini Pro & Flash, Langfuse, LangGraph, опционально DSPy.

Eval‑driven мышление. Способность мыслить в цикле «гипотеза → критерий → метрика → измерение → итерация». Вы должны задавать вопросы о golden‑датасете и метриках успеха до того, как начнёте писать промпт.
Опыт работы с LLM‑as‑a‑Judge. Практический опыт построения и валидации автоматизированных «судей». Знание и понимание ключевых метрик:
- Precision, Accuracy, Recall, F1;
- weighted Cohen’s κ;
- Spearman;
- MAE/RMSE и др.
Промпт‑инжиниринг как инженерия. Владение и понимание техник промпт‑инжиниринга, а не просто их знание:
- цепочка рассуждений (Chain-of-Thought);
- few‑shots;
- структурированный вывод;
- самосогласованность;
- ролевая установка;
- декомпозиция промпта.
EdTech‑грамотность. Наличие хотя бы одного из пунктов:
- опыт работы в EdTech‑продукте;
- системное знание педагогических рамок (скаффолдинг, теория когнитивной нагрузки (CLT), таксономии Блума (Bloom), DoK, SOLO);
- опыт преподавания школьникам или репетиторства (математика, информатика, русский язык).
Гигиена работы с данными. Понимание методологий разметки данных:
- принцип двойного перекрытия;
- согласованность между разметчиками;
- предотвращение утечки данных между обучающей (train) и оценочной (eval) выборками;
- чувствительность к формулировкам промптов.

Будет плюсом:

опыт работы с DSPy и programmatic prompting, понимание работы оптимизаторов;
опыт с фреймворками для построения агентных систем: LangGraph, Pydantic AI, OpenAI Agents SDK;
знание паттернов проектирования мультиагентных систем;
опыт spec‑driven разработки и осознанного использования AI‑ассистентов для кодирования (Claude Code, Cursor), понимание их сильных и слабых сторон.

Что мы предлагаем?

Удаленный формат сотрудничества.
Мы используем современные мессенджеры и Zoom.
Свободу при выполнении своих обязанностей и отсутствие микроменеджмента: мы доверяем вовлечённым и проактивным.
Участие в создании образовательных продуктов, которых еще не было на рынке РФ.
Команду, которая стремится сделать качественный и востребованный продукт.