Название вакансии: NLP-инженер (Domain-Specific, Классификация текстов)
О компании: Наша компания разрабатывает передовые интеллектуальные системы для трансформации работы с данными в нефтегазовой отрасли. Мы создаем продукты, которые помогают специалистам принимать точные и обоснованные решения.
О продукте:
Вы будете работать над ключевым элементом нашей платформы — «Семантическим роутером». Это высоконагруженный микросервис, который в реальном времени анализирует и классифицирует текстовые запросы пользователей для их дальнейшей обработки сложными системами поиска и AI.
Задача:
Провести глубокий анализ и полный редизайн системы классификации запросов.
Наш текущий MVP-подход с 4 классами показал точность на живых данных ~34%, в то время как на тестовых данных она достигает 97%. Ваша задача — закрыть этот разрыв, спроектировав и внедрив новую, детализированную систему классификации, учитывающую всю сложность и специфику предметной области.
Чем предстоит заниматься:
* Проведение анализа реальных пользовательских запросов для выявления паттернов, интентов и специфической терминологии.
* Разработка иерархической (многоуровневой) классификационной схемы и доменной онтологии для нефтегазовой отрасли.
* Создание и обучение моделей NLP/NLU для точного определения намерений пользователя (Intent Classification) и извлечения сущностей (NER).
* Разработка алгоритмов для обработки комбинированных и неоднозначных запросов.
* Интеграция новых моделей в существующую production-систему, обеспечение обратной совместимости и мониторинг качества.
* Постоянная работа над улучшением метрик точности и пользовательского опыта.
Мы ищем специалиста, который имеет:
* Опыт работы в области NLP/NLU от 2-х лет.
* Уверенные знания и практический опыт работы с Python и основными библиотеками (Transformers, spaCy, NLTK, Scikit-learn и т.д.).
* Опыт обучения и тонкой настройки (fine-tuning) языковых моделей (BERT/RoBERTa и аналоги).
* Понимание задач классификации текстов, извлечения сущностей (NER), работы с онтологиями и таксономиями.
* Опыт работы с реальными production-данными (обработка несбалансированных выборок, работа с шумом, опечатками).
* Способность к глубокому анализу и системному мышлению.
Будет огромным плюсом:
* Опыт работы со специфическими предметными областями (domain-specific NLP): медицина, юриспруденция, нефтегазовая/геологоразведочная отрасль и т.д.
* Знание основ лингвистики.
* Опыт работы с векторными и графовыми базами данных.
* Навыки работы с Docker, Kubernetes, системами мониторинга ML-моделей.
Мы предлагаем:
* Возможность решить сложную и интересную задачу с огромным impact на конечный продукт.
* Работу в команде экспертов, где ваше мнение будет ключевым.
* Современный технологический стек и полный цикл реализации своих идей — от анализа до внедрения в продакшен.
* Конкурентную «белую» заработную плату, гибкий график и возможность удаленной работы.
* Корпоративный ДМС и другие бенефиты.
Ключевые метрики вашего успеха:
* Повышение точности классификации на живых данных с 34% до 85%+.
* Снижение доли необработанных запросов до ≤5%.
Готовы стать нашим экспертом в области NLP?
Откликайтесь на вакансию!
Промконсалт
Москва
от 250000 RUR