NLP-разработчик в Браузер

Яндекс

NLP-разработчик в Браузер

Описание вакансии

Наше направление проводит последний год в диком драйве.Мы запустили Нейросаппорта, Нейроэксперта — и это только начало: мы постоянно исследуем возможности запуска новых проектов. Сейчас наша ML-команда, объединяющая большой опыт в NLP и RecSys, занимается разработкой Нейроюриста, который помогает специалистам в юридической сфере отвечать на правовые вопросы и анализировать юридические документы. Мы ждём новых коллег, которые будут делать нашего юридического помощника круче!

Структура нашей проектной команды — гибридная матричная: есть и команды отдельных продуктов, и общие технические решения и команды, которые за них отвечают. В качестве стека используем Go и Python для бэкендов, Svelte для UI, строим пайплайны для наших сервисов на собственной ML-платформе и используем набор LLM-моделей, которые обучаем сами или совместно с классными инженерами Яндекса.

Какие задачи вас ждут

Улучшение LLM- и RAG-пайплайнов
У нас уже есть RAG-пайплайн, который работает с десятками миллионов юридических документов — больше, чем другие юридические помощники. Документов становится всё больше, а качество получения релевантных документов должно быть всё выше! Кроме того, вам предстоит создавать и улучшать LLM-пайплайны, чтобы помогать юристам с растущим объёмом задач.

Дообучение и настройка моделей
Понадобится работать с внутренними и опенсорс-моделями, адаптировать их под специфику различных сфер права и юридических процессов, обеспечивая при этом высокое качество и точность ответов. Вы будете как подбирать промты и параметры модели, так и дообучать их (fine-tuning, RL), а также оптимизировать для инференса (квантизация, дистилляция, speculative decoding).

Разработка юридических LLM-агентов
Анализ договоров и дополнений к ним, проверка на соответствие законодательству и корпоративной политике, подбор судебной практики — эти и многие другие кейсы можно доверить LLM-агентам, которые вам предстоит разрабатывать. Кейсы у нас непростые, поэтому за один поход в LLM всё не решится: надо придумать многошаговые процессы с маршрутизацией, выбором инструментов и моделей, а также с управлением вызовами функций.

Мы ждем, что вы

  • Знакомы с Python и SQL
  • Умеете применять различные методы анализа данных и ML
  • Разбираетесь в NLP и LLM
  • Готовы внедрять и поддерживать ML-модели в рантайме и автоматизировать сопутствующие процессы

Будет плюсом, если вы

  • Знакомы с C++ или Go
  • Разрабатывали проекты на основе LLM и RAG
  • Работали в других доменах ML (классическое ML, RecSys, CV)
  • Разбираетесь в юридической сфере
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию