Data Scientist, NLP, Ozon Банк

Ozon

Data Scientist, NLP, Ozon Банк

Москва, Центральный административный округ, Пресненский район, Московский международный деловой центр Москва-Сити, многофункциональный комплекс Башня на Набережной

Метро: Деловой центр

Описание вакансии

Ozon Банк — это подразделение Ozon, где тесно переплетается всё, что связано с финансами и IT. Мы создаём новые для рынка продукты и сервисы для физических и юридических лиц. Главное для нас — удобство пользователей. Гордимся атмосферой в командах: каждый сотрудник может влиять на процессы и пути к результату.

Сейчас мы ищем middle Data Scientist в команду, которая занимается всеми NLP задачами в компании, в том числе: RAG для различных бизнес-направлений, чат-бот поддержки, speech-to-text, OCR с использованием LLM, задачи кодогенерации а также любые другие запросы от бизнеса, связанные с текстовыми данными. Эти модели напрямую влияют на доходность компании и определяют итоговую прибыль кредитных продуктов. Мы развиваем мощности нашего ЦОД для прикладных и исследовательских задач и самостоятельно прорабатываем и запускаем решения в прод.

Наш стек:

  • БД: Vertica, PostgreSQL, Clickhouse
  • Разметка: Labelstudio
  • Обучение моделей: Pytorch + Accelerate
  • Деплой: Tritonserver в k8s
  • RAG: QDrant, Elasticsearch, Langchain

Вам предстоит:

  • Активно участвовать во всех проектах команды
  • Главный фокус - задачи для чат-бота поддержки. На первых этапах – использование моделей для помощи операторам (суммаризация, парафраз, RAG), c последующей их полной заменой LLM. Также развиваем STT и TTS направления для обработки звонков пользователей

Ждем от вас:

  • Умение внятно излагать мысли и представлять результаты своей работы
  • Уверенный Python, умение разбираться в чужом коде
  • Понимание основных принципов, алгоритмов и метрик классического ML
  • NLP: опыт решения бизнес-задач с использованием классических и трансформерных моделей. Умение понимать, где какую модель лучше использовать и почему
  • LLM: понимание принципов работы, а также ограничений в применении тех или иных моделей. Приветствуется наличие навыков prompt engineering’а, а также использования structured outputs и function calling’а у моделей. Потенциально будем разворачивать агентские системы – будет плюсом опыт общения с соответствующими фреймворками, например, smolagents
  • Деплой: опыт деплоя трансформерных моделей с использованием какого-либо фреймворка для деплоя (vllm, sglang), понимание того, как работает в таких фрейворках обработка запросов и как ее можно ускорить. Будет плюсом опыт с tritonserver и tensorrt-LLM
Навыки
  • Data Science
  • Разработка ПО
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию