Senior Data Scientist в команду NLP Search

2ГИС

Senior Data Scientist в команду NLP Search

Описание вакансии

Какие задачи мы решаем

  • Разрабатываем ML-модели для поиска и ранжирования организаций по пользовательским запросам.
  • Улучшаем механизмы понимания и обработки поисковых запросов: сегментация текста, исправление опечаток, генерация автодополнений.
  • Разрабатываем ML-модели для объяснимости выдачи: связывание товаров, услуг, атрибутов и отзывов с организациями.
  • Делаем классификацию и кластеризацию запросов и организаций для повышения точности поиска.
  • Разрабатываем ML-модели для саммаризации отзывов, извлечения фактов и других полезных данных из неструктурированных текстов.

Мы ждем, что Вы

  • Работаете над NLP-задачами более 3 лет и имеете опыт реализации решений в реальных продуктах.
  • Хорошо понимаете архитектуры современных моделей: BERT, T5, GPT и их вариаций – знаете их сильные и слабые стороны.
  • Владеете Python и уверенно работаете с PyTorch, HF Transformers и другими ключевыми ML/DL-библиотеками.
  • Умеете строить полный ML-пайплайн: от исследований и обучения до вывода модели в продакшен и поддержки инференса.
  • Работали с задачами semantic search, query understanding, извлечения embedding-представлений и reranking.
  • Умеете оценивать качество поисковых систем: Recall@K, MRR, NDCG, как в offline, так и в A/B-тестах.

Будет крутым бонусом, если Вы

  • Знаете принципы оптимизации ML/DL-моделей и использовали библиотеки Triton, FasterTransformer, ONNX и другие.
  • Разрабатывали ML-модели для задач поиска и ранжирования, в частности системы генерации кандидатов и dense retrieval с использованием FAISS, Usearch, ColBERT.
  • Имеете опыт взаимодействия с backend/infra: FastAPI, Docker, gRPC, Kafka, Clickhouse, Kubernetes.
  • Работали с инструментами для разработки LLM инфраструктуры: LangChain, LoRA/PEFT, vLLM, SGLang и другие.
  • Участвовали в исследовательских или pet-проектах в области NLP – особенно приветствуются статьи, open-source и публичные демо.

Почему стоит к нам присоединиться

  • Сложные задачи в реальном продукте – миллионы пользователей, огромный справочник организаций, разнообразие и сложность данных.
  • Свобода выбирать технологии – мы используем передовые ML/NLP-инструменты и ищем лучшие решения.
  • Влияние на продукт – у вас будет возможность создавать полезные фичи, которые делают поиск лучше и помогают людям каждый день.
  • Сильная команда – с которой можно расти и масштабировать крутые ML-решения.
  • Фокус на эксперименты – много A/B-тестирования, исследовательской работы, поиск оптимальных архитектур.
  • Современный стек – PyTorch, Transformers, LangChain, Triton, ONNX, FastAPI, Kafka, Kubernetes.

Почему у нас классно

  • 2ГИС – аккредитованная IT-компания.
  • Можно работать удалённо. Для нас важен специалист, а не его локация. Если хочешь работать в гибридном формате, есть офисы в Москве, Санкт-Петербурге, два классных офиса в Новосибирске. А также коворкинги в Нижнем Новгороде, Томске, Астане, Алма-Ате.
  • Само собой, полностью белая зарплата.
  • Заботимся о здоровье: ДМС и возможность получать онлайн-консультации и терапевта, невролога, психолога и медицинского агента.
  • Если хочешь делиться своим опытом, мы только за – поможем с выступлениями на конференциях и статьями для Хабра/VC.
  • Есть собственный учебный центр: курсы, тренинги и книги для прокачки скиллов.
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию