Data scientist NLP

Описание вакансии

DataOffice - это драйвер DataDriven культуры в Ростелекоме, один из лидеров отрасли управления данными в России. DataOffice объединяет 300 профессионалов в области ИТ-технологий.

В компании расширяется команда для разработки сервисов на базе больших языковых моделей: прикладные настольные приложения для повышения эффективности сотрудников и внедрение ИИ в программные продукты РТК (Яга/Ежка, аналоги Jira/Trello/Confluence, ITSM и т.д.).

Примеры сервисов:

  • Виртуальный помощник на базе LLM;
  • Генерация формального текста или шаблона задачи из свободного описания;
  • Формирование саммари текстов;
  • Построение RAG систем по документам, базам данных;
  • Интеллектуальная нарезка историй и задач на подзадачи или пункты и выделение именованных сущностей из них.

Что мы ожидаем от кандидата:

  • Опыт работы в роли Data scientist от 2 лет;
  • Работа с одним из фреймворков PyTorch/TensorFlow;
  • Знание основных подходов для предобработки и векторизации текста;
  • Наличие опыта решения задач NLP для текста (Text Classification, NER, Text Summarization);
  • Знакомство и понимание основных принципов современных SOTA моделей NLP;
  • Владение: git, docker, sql и одним из фреймворков для реализации api.

Будет плюсом:

  • Участие в соревнованиях по ML/DL;
  • Практический опыт до обучения и работы с open source LLM;
  • Публикации по NLP;
  • Собственные проекты по NLP.

Мы предлагаем:

  • Работа в крупнейшем в России интегрированном провайдере цифровых решений;
  • Возможна полная или частичная удаленная работа из России;
  • В Москве - БЦ Академик, победивший в номинации лучший проект «Бизнес-центр класса А. Москва» Возможность работать из офисов в городе Краснодар и Новосибирск.
  • Официальное оформление в аккредитованную Ит компанию — согласно ТК РФ (полный соц. пакет: ежегодный оплачиваемый отпуск 28 календарных дней, оплата больничных);
  • Официальная заработная плата (оклад и годовая премия);
  • Кафетерий льгот с 1 рабочего дня: ДМС, компенсация транспорта, интернета, спорта, обучения и др.;
  • Корпоративное обучение: внутренние митапы, участие в конференциях, доступ к корпоративным библиотекам технической и бизнес литературы.
Навыки
  • PyTorch
  • Python
  • TensorFlow
  • Deep Learning
  • Big Data
  • LLM
  • NLP
  • NER
  • Text Classification
  • Text Summarization
Посмотреть контакты работодателя

Похожие вакансии

Лемана ПРО
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Employcity

Data Scientist

Employcity

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Effective
Удаленная работа
  • Москва

  • до 320000 RUR

Рекомендуем
СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 320000 RUR

Платформа Третье Мнение

NLP Engineer

Платформа Третье Мнение

Удаленная работа
  • Москва

  • до 320000 RUR

Ozon
Удаленная работа
  • Москва

  • до 320000 RUR

X5 Tech
Удаленная работа
  • Москва

  • до 320000 RUR

Мегахант
Удаленная работа
  • Москва

  • до 320000 RUR

FIX PRICE

Data Scientist

FIX PRICE

Удаленная работа
  • Москва

  • до 320000 RUR

А ДЕНЬГИ

Data Scientist (Риски)

А ДЕНЬГИ

Удаленная работа
  • Москва

  • до 320000 RUR

Ozon
Удаленная работа
  • Москва

  • до 320000 RUR

банк Раунд
Удаленная работа
  • Москва

  • до 320000 RUR

Lamoda Tech
Удаленная работа
  • Москва

  • до 320000 RUR

IDF Eurasia

Junior Data Scientist

IDF Eurasia

Удаленная работа
  • Москва

  • до 320000 RUR

STARTRIBE LTD

Senior Data Scientist

STARTRIBE LTD

Удаленная работа
  • Москва

  • до 320000 RUR

PARI
Удаленная работа
  • Москва

  • до 320000 RUR

Data Engineer (Junior)

Левченко Екатерина Валериевна

Удаленная работа
  • Москва

  • до 2000 USD

АНО ЦИСМ

Data Engineer

АНО ЦИСМ

Удаленная работа
  • Москва

  • до 2000 USD

Ок Софт

Antifraud data analyst

Ок Софт

Удаленная работа
  • Москва

  • до 2000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию