NLP engineer (GigaChat Pretrain Data)

СБЕР

NLP engineer (GigaChat Pretrain Data)

Описание вакансии

Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а работать с реально большими данными, то вот твой шанс.

Обязанности:

  • чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) → LLM-парсинг + Code Execution Feedback;
  • генерить синтетические данные;
  • разбираться с токенизацией;
  • кластеризовать данные;
  • писать дедупликацию на Rust;
  • оптимизировать MapReduce → Spark, тысячи ядер;
  • экспериментировать с SFT и RL → DPO, DRPO, увеличиваем качество синтетики.

Требования:

  • выпускник ШАД/ ВШЭ Факультета компьютерных наук/ МФТИ Факультета инноваций и высоких технологий
  • имеешь коммерческий релевантный опыт в роли NLP Engineer от двух лет
  • навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов
  • инструментальное владение AI для анализа, генерации и автоматизации.

Условия:

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы (2 дня в офисе, 3 дня на удалёнке)
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • льготная программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.

Посмотреть контакты работодателя

Похожие вакансии

СБЕР

NLP Engineer

СБЕР

Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
Лига Цифровой Экономики

ML engineer

Лига Цифровой Экономики

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Лига Цифровой Экономики

ML Engineer

Лига Цифровой Экономики

Удаленная работа
  • Москва

  • Не указана

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Lead Data Scientist (AI)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • Не указана

Лига Цифровой Экономики

ML-инженер

Лига Цифровой Экономики

Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

VK
Полный день
  • Москва

  • Не указана

Innovative People

ML engineer

Innovative People

Удаленная работа
  • Москва

  • Не указана

2ГИС
Удаленная работа
  • Москва

  • Не указана

Ozon
Удаленная работа
  • Москва

  • Не указана

Перспектива

Senior NLP/ML Engineer

Перспектива

Удаленная работа
  • Москва

  • до 400000 RUR

Rubytech
Полный день
  • Москва

  • до 400000 RUR

СБЕР
Удаленная работа
  • Москва

  • до 400000 RUR

Инфосистемы Джет

MLOps - инженер

Инфосистемы Джет

Удаленная работа
  • Москва

  • до 400000 RUR

Перспектива

Pre middle NLP/ML Engineer

Перспектива

Удаленная работа
  • Москва

  • до 200000 RUR

ВсеИнструменты.ру

Senior ML Engineer

ВсеИнструменты.ру

Удаленная работа
  • Москва

  • до 200000 RUR

СОГАЗ
Полный день
  • Москва

  • до 200000 RUR

Онкодиагностика Атлас

Биоинформатик / Data-Engineer

Онкодиагностика Атлас

Полный день
  • Москва

  • до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию