Инженер-программист NLP/NLU

Jobers

Инженер-программист NLP/NLU

Описание вакансии

Вакансия компании: ООО Террикса

Название вакансии: NLP-инженер (Domain-Specific, Классификация текстов)

О компании: Наша компания разрабатывает передовые интеллектуальные системы для трансформации работы с данными в нефтегазовой отрасли. Мы создаем продукты, которые помогают специалистам принимать точные и обоснованные решения.

О продукте:

Вы будете работать над ключевым элементом нашей платформы — «Семантическим роутером». Это высоконагруженный микросервис, который в реальном времени анализирует и классифицирует текстовые запросы пользователей для их дальнейшей обработки сложными системами поиска и AI.

Задача:

Провести глубокий анализ и полный редизайн системы классификации запросов.

Наш текущий MVP-подход с 4 классами показал точность на живых данных ~34%, в то время как на тестовых данных она достигает 97%. Ваша задача — закрыть этот разрыв, спроектировав и внедрив новую, детализированную систему классификации, учитывающую всю сложность и специфику предметной области.

Чем предстоит заниматься:

* Проведение анализа реальных пользовательских запросов для выявления паттернов, интентов и специфической терминологии.

* Разработка иерархической (многоуровневой) классификационной схемы и доменной онтологии для нефтегазовой отрасли.

* Создание и обучение моделей NLP/NLU для точного определения намерений пользователя (Intent Classification) и извлечения сущностей (NER).

* Разработка алгоритмов для обработки комбинированных и неоднозначных запросов.

* Интеграция новых моделей в существующую production-систему, обеспечение обратной совместимости и мониторинг качества.

* Постоянная работа над улучшением метрик точности и пользовательского опыта.

Мы ищем специалиста, который имеет:

* Опыт работы в области NLP/NLU от 2-х лет.

* Уверенные знания и практический опыт работы с Python и основными библиотеками (Transformers, spaCy, NLTK, Scikit-learn и т.д.).

* Опыт обучения и тонкой настройки (fine-tuning) языковых моделей (BERT/RoBERTa и аналоги).

* Понимание задач классификации текстов, извлечения сущностей (NER), работы с онтологиями и таксономиями.

* Опыт работы с реальными production-данными (обработка несбалансированных выборок, работа с шумом, опечатками).

* Способность к глубокому анализу и системному мышлению.

Будет огромным плюсом:

* Опыт работы со специфическими предметными областями (domain-specific NLP): медицина, юриспруденция, нефтегазовая/геологоразведочная отрасль и т.д.

* Знание основ лингвистики.

* Опыт работы с векторными и графовыми базами данных.

* Навыки работы с Docker, Kubernetes, системами мониторинга ML-моделей.

Мы предлагаем:

* Возможность решить сложную и интересную задачу с огромным impact на конечный продукт.

* Работу в команде экспертов, где ваше мнение будет ключевым.

* Современный технологический стек и полный цикл реализации своих идей — от анализа до внедрения в продакшен.

* Конкурентную «белую» заработную плату, гибкий график и возможность удаленной работы.

* Корпоративный ДМС и другие бенефиты.

Ключевые метрики вашего успеха:

* Повышение точности классификации на живых данных с 34% до 85%+.

* Снижение доли необработанных запросов до ≤5%.

Готовы стать нашим экспертом в области NLP?

Откликайтесь на вакансию!

Посмотреть контакты работодателя

Похожие вакансии

Unreal Engine Developer

Григорьев Максим Александрович

Удаленная работа
  • Москва

  • от 80000 RUR

Рекомендуем

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию