Senior Data Engineer / ML Engineer (GigaChat)

СБЕР

Senior Data Engineer / ML Engineer (GigaChat)

Описание вакансии

Наша команда отвечает за качество моделей Text-to-speech в GigaChat – той части нейросети, которая занимается звуком.

Сейчас мы ищем сотрудников, которые будут работать над базовым качеством, мультимодальным Гигачатом и другими классными проектами.

Обязанности

  • 60% data engineer, 25% developer, 15% ML
  • писать пайплайны обработки аудио/видео данных
  • подготовка датасетов для обучения и дообучения llm
  • интегрироваться с ml/llm пайплайнами, бэкендом
  • внедрять новые решения/фреймворки/тулы в части работы с данными
  • улучшать надежность и масштабируемость дата процессов
  • инферить опенсорсные и внутренние модели на гпу (денойзер, распознавание, тулы для оценки качества аудио)
  • поддержка хранилища данных.

Требования

  • python и алгоритмы на хорошем уровне + ООП
  • опыт с multithreading и multiprocess
  • опыт разработки продакшн-сервисов и дата-пайплайнов
  • понимание жизненного цикла LLM
  • понимание подходов к контролю качества данных.
  • S3 (важно), dvc.

Условия

  • гибридный или удаленный формат работы
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 7%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию