ML Engineer (ASR, GigaChat Data)

СБЕР

ML Engineer (ASR, GigaChat Data)

Описание вакансии

Мы — команда GigaChat Data, готовим данные для обучения базовых моделей GigaChat во всех модальностях (Text, Vision, Audio): SFT, RLHF, навыки, безопасность и продуктовые сценарии.

Сейчас ищем специалистов в данные под проекты, связанные с ML на устройствах: офлайн-ассистент, локальное ASR, keyword spotting, VAD/EOU и персонализация.

Направления задач:

  • Данные для on-device ассистента - Сбор и подготовка данных для валидации и обучения локальных компонентов: ASR, spotter, VAD/EOU.
  • Пайплайны данных - Построение процессов сбора, очистки, сегментации и разметки данных, включая работу с сырыми аудиоканалами и логами с устройств.
  • Разметка и схемы аннотации - Проектирование и внедрение разметки для новых сценариев: офлайн-команды, EOU, VAD, персонализация.
  • Данные под новые фичи - Подготовка датасетов для offline ASR, quick commands, offline assistant и персонализации.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • подготовка данных для обучения и тестирования моделей
  • разработка и поддержка data pipeline’ов
  • анализ качества моделей через данные и метрики
  • поиск точек роста и проблемных сценариев
  • работа с продовыми и beta-логами устройств.

Требования

  • уверенный Python (алгоритмы, структуры данных, async)
  • опыт работы с данными в ML-задачах
  • понимание метрик качества моделей
  • базовая статистика
  • опыт в speech-задачах (ASR, VAD, diarization, keyword spotting)
  • опыт построения data pipeline’ов
  • опыт с разметкой и краудсорсингом.

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Центральный банк Российской Федерации (Банк России)

Lead ML Engineer (Computer Vision)

Центральный банк Российской Федерации (Банк России)

  • Москва

  • Не указана

СБЕР

Data Engineer

СБЕР

  • Москва

  • Не указана

Центральный банк Российской Федерации (Банк России)

ML-инженер

Центральный банк Российской Федерации (Банк России)

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Центральный банк Российской Федерации (Банк России)

Lead/Senior ML Engineer (NLP/RAG)

Центральный банк Российской Федерации (Банк России)

  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию