Data Scientist Teamlead NLP

Газпромбанк

Data Scientist Teamlead NLP

Описание вакансии

Что нужно делать:
• имплементация и обучение SOTA NLP моделей, как для русского языка, так и мультиязычных;
• эксперименты по созданию новых архитектур, оценка языковых моделей;
• работа над созданием надежного, быстрого и масштабируемого пайплайна для обучения LLM;
• адаптация LLM для задач обслуживания внутренних и внешних клиентов, адаптация LLM под специфичные домены;
• задачи полнотекстового анализа: кластеризация, классификация, тематическое моделирование, выделение именованных сущностей, суммаризация, идентификация трендов, анализ тональности;

• речевая аналитика (оценка качества работы операторов, формирование рекомендации);
• анализ обращений и отзывов;
• разработка чат-ботов;
• применение ML/DL на KG и базах знаний;
• тестирование данных, гипотез, моделей;
• доведение разработанной модели до вывода в production;
• плотно общаться с продуктовой командой, бизнес-заказчиком и определять компоненты ml-продуктов;
• разрабатывать system design решений;
• управлять полным циклом разработки: взаимодействие с аналитиками, дата инженерами, MLOps- и DevOps-специалистами.

Наши ожидания от кандидата:

• высшее техническое/математическое образование;
• опыт работы DS от 3 лет;
• понимание принципов классического ML, владение стандартным набором python-библиотек для ML;
• опыт работы с NLP, понимание текущего состояния в области NLP (отдельные архитектуры, конкретные приложения к задачам);
• опыт работы с языковыми моделями, понимание подходов к обучению LLM;
• хорошее понимание современных архитектур нейронных сетей;
• умение читать и разбирать статьи о новых архитектурах и подходах;
• понимание принципов обучения, тюнинга, оценки deep learning моделей;
• опыт отладки нейронных сетей и модификации архитектур или создания собственных;

• опыт внедрения моделей в production, построения промышленных NLP решений с применением DL алгоритмов;
• понимание принципов ведения разработки, ведения документации;
• умение говорить с бизнес-заказчиком на одном языке, переводить задачу с языка бизнеса в ML постановку;
• способность самостоятельно делать R&D в новых темах;
• умение работать в команде;
• уверенное знание SQL, Python, PyTorch, Docker, Hadoop, DVC, git.

Желательно:
• опыт работы pyspark, airflow;
• опыт распределенного обучения на нескольких GPU и серверах;
• опыт оптимизации или сжатия/дистилляции моделей (прунинг, квантование, onnx);
• опыт воспроизведения статей в коде;
• наличие публикаций по Deep Learning;
• участие в конференциях.

Посмотреть контакты работодателя

Похожие вакансии

Samokat.tech
Удаленная работа
  • Москва

  • Не указана

Рекомендуем

Senior Data Scientist, FinTech

РЕСТАДВАЙЗЕР

Удаленная работа
  • Москва

  • от 300000 RUR

Рекомендуем
Автомакон

Data Scientist Middle MLE

Автомакон

Удаленная работа
  • Москва

  • до 300000 RUR

Рекомендуем
Автомакон
Удаленная работа
  • Москва

  • до 300000 RUR

Ozon
Удаленная работа
  • Москва

  • до 300000 RUR

Циан
Удаленная работа
  • Москва

  • до 300000 RUR

Профи (profi.ru)
Удаленная работа
  • Москва

  • до 450000 RUR

Spice Agency

Data Scientist

Spice Agency

Удаленная работа
  • Москва

  • до 450000 RUR

Т1
Удаленная работа
  • Москва

  • до 450000 RUR

Nexpanse
Удаленная работа
  • Москва

  • от 100000 RUR

Домклик
Удаленная работа
  • Москва

  • от 100000 RUR

билайн

Data Scientist (CVM)

билайн

Удаленная работа
  • Москва

  • от 100000 RUR

Т1
Удаленная работа
  • Москва

  • от 100000 RUR

Fundraise Up
Удаленная работа
  • Москва

  • от 100000 RUR

Ozon
Удаленная работа
  • Москва

  • от 100000 RUR

RapidSeedbox ltd

Data Scientist/Analyst

RapidSeedbox ltd

Удаленная работа
  • Москва

  • до 1500 USD

Ozon
Удаленная работа
  • Москва

  • до 1500 USD

Удаленная работа
  • Москва

  • от 140000 RUR

Леруа Мерлен
Удаленная работа
  • Москва

  • от 140000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию