Data Scientist в проект GigaChat

СБЕР

Data Scientist в проект GigaChat

Москва, Кутузовский проспект, 32к1

Метро: Кутузовская

Описание вакансии

Мы ищем Data Scientist для работы над данными pretrain языковых моделей типа ChatGPT Куда: прод команда больших языковых моделей в SberDevices

Задачи:

  • майнить данные: писать и запускать код для сбора данных с разных платформ (где есть много данных, которых нет в Common Crawl)
  • собирать параллельные корпусы текста для машинного перевода
  • очищать данные: обрабатывать сырые данные из интернета, выкидывать рекламные блоки, непонятные блоки, использовать существующие или обучать новые языковые модели для решения подобных задач
  • убирать дубликаты: оптимизировать объем данных для экономии ресурсов на обучение, удалять дубли и схожий контент, использовать существующие или обучать новые языковые модели для решения подобных задач
Требования:
  • диплом ШАДа с заветными тремя словами: Natural language processing
Условия:
  • масштабные, сложные и разнообразные задачи, находящиеся на острие инноваций
  • сильная команда отзывчивых профи и гуру, которые всегда помогут
  • текущий объем датасета 4Тб текста, будет намного больше
  • фидбек и возможность увидеть результаты своей работы в продукте
  • своя digital-платформа для развития ключевых IT-компетенций, внутренние и внешние конференции и проф. сообщества Сбера
  • много корпоративных плюшек
  • расширенная программа ДМС (возможность подключения родственников), страхование жизни
  • специальные условия по кредитам/ипотеке, скидки от компаний-партнёров
  • знаменитый офис на Кутузовском проспекте с парковкой, спортзалом, массажными креслами и возможностью выбора формата работы (офис или гибрид)
  • атмосфера стартапа и надёжность гиганта.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Газпромбанк
Полный день
  • Москва

  • Не указана

Рекомендуем
МегаФон

Middle Data Scientist

МегаФон

Полный день
  • Москва

  • Не указана

Рекомендуем
Московский Кредитный Банк

Data Scientist (Аналитик данных)

Московский Кредитный Банк

Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР

Data scientist

СБЕР

Полный день
  • Москва

  • Не указана

ARK
Полный день
  • Москва

  • Не указана

ЛУКОЙЛ

Data Scientist

ЛУКОЙЛ

Полный день
  • Москва

  • Не указана

Т1
Удаленная работа
  • Москва

  • Не указана

WILDBERRIES
Полный день
  • Москва

  • Не указана

Эр-1
Полный день
  • Москва

  • Не указана

Аналитический центр при Правительстве Российской Федерации

Middle Data Scientist

Аналитический центр при Правительстве Российской Федерации

Полный день
  • Москва

  • Не указана

Бэнкс Софт Системс

Data Scientist

Бэнкс Софт Системс

Полный день
  • Москва

  • Не указана

Ventra IT Solutions
Гибкий график
  • Москва

  • до 200000 RUR

Цифровые технологии и платформы

Senior Data Scientist

Цифровые технологии и платформы

Полный день
  • Москва

  • до 200000 RUR

Ростелеком

Data Scientist

Ростелеком

Удаленная работа
  • Москва

  • до 200000 RUR

Цифровые технологии и платформы

Senior Data Scientist (NLP)

Цифровые технологии и платформы

Полный день
  • Москва

  • до 200000 RUR

РТЛабс
Полный день
  • Москва

  • до 200000 RUR

Ozon
Удаленная работа
  • Москва

  • до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию