Vision Pretain Data Lead (VLM, GigaChat Vision)

СБЕР

Vision Pretain Data Lead (VLM, GigaChat Vision)

Описание вакансии

Pretrain - является самым масштабным и затратным этапом обучения VLM.

На нем закладывается огромный фундамент возможностей модели, который позволяет в дальнейшем ей быть полезной пользователю и решать задачи CV. Нам требуется эксперт, который понимает какие данные двигают качество, весь скоуп задач компьютерного зрения и подходы к их решению, будет собирать процессы вокруг обогащения претрейна самыми качественными и необходимыми данными для множества доменов, оценивать качество и сложность датасетов, создавать полезные дашборды, заботиться о воспроизводимости. Нужен хороший организатор дата-команды и дата-пайплайнов с сильными техническими навыками.

Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным!

Обязанности

  • строить data engine для pretrain и stage 1.5;
  • отвечать за sourcing, curation, dedup, filtering, balancing и mixture design;
  • выявлять слабые места в данных, влияющие на качество модели, составлять план по улучшению и реализовывать план в срок;
  • управлять качеством данных и воспроизводимостью;
  • организовывать статистику, срезы и мониторинг по данным;
  • работать с training/eval командами;
  • приоритизировать ручную и полуавтоматическую обработку там, где это эффективнее полной автоматизации;
  • нанимать и вести дата-инженеров.

Требования

  • опыт работы в production команде (сборка окружения, выкатка моделей как оффлайн, так и онлайн, большие нагрузки как преимущество);
  • понимание, как данные влияют на качество VLM;
  • опыт построения дата пайплайнов и data quality процессов;
  • умение ставить задачи дата-инженерам, девопсам/ML-опсам, ML разработчикам;
  • умение приоритизировать задачи, распределять имеющиеся ресурсы;

Условия

  • крупнейшее DS&AI community — более 600 DS-специалистов банка
  • дайджест о самых последних разработках в области DS&AI и отчеты с крупнейших конференций мира
  • возможность быть соавтором НИРов и статей для международных конференций
  • возможность выбрать удобный формат работы: гибрид или офис
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека выгоднее до 7% для каждого сотрудника
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Яндекс
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Гоуланг Технологии

Lead Data Engineer (Stack: Go / Python / Kotlin)

Гоуланг Технологии

  • Москва

  • Не указана

Лаборатория Касперского

Senior AI Engineer

Лаборатория Касперского

  • Москва

  • Не указана

585, Холдинг

AI Lead

585, Холдинг

  • Москва

  • Не указана

Мокка
  • Москва

  • Не указана

РДП Энтерпрайз

Tech Lead (телеком)

РДП Энтерпрайз

  • Москва

  • Не указана

GRI
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию