ML Engineer в центр робототехники

СБЕР

ML Engineer в центр робототехники

Описание вакансии

В Центре робототехники Сбера мы обучаем модели, которые должны управлять роботами в сложных реальных условиях. Для этого мало просто собрать большое количество данных: нужно понимать, какие записи полезны, где в них ошибки и каких примеров модели не хватает. Сейчас нам нужен Data Analyst / Data Engineer в Data Conveyor Team, который будет находить проблемы в данных, оценивать их качество и проверять через обучение моделей, как состав датасета влияет на результат.

Это роль на стыке анализа данных, инженерии данных и практических ML-экспериментов: нужно не только строить проверки качества, но и запускать обучение или дообучение моделей на разных версиях данных, сравнивать метрики и превращать выводы в конкретные решения по сбору, разметке, фильтрации и выборке.

Первый этап отбора на эту вакансию — общение с AI-рекрутером. После отклика ждите сообщение от него, диалог зайдёт примерно 10 минут. Задача AI-рекрутера — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. AI-рекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным для всех!

Обязанности

  • строить автоматические и полуавтоматические пайплайны проверки качества данных, чтобы находить технические и смысловые дефекты до попадания данных в обучение
  • запускать или сопровождать обучение и дообучение моделей на разных версиях датасетов, чтобы измерять влияние качества, состава и фильтрации данных на метрики модели
  • разрабатывать метрики качества данных и использовать их как диагностический сигнал до тех пор, пока не доказана связь с успешностью модели на роботе и в тестовых сценариях
  • формировать фильтры, уровни качества и стратегии выборки по качеству, разнообразию, задачам, объектам, окружениям, роботам, источникам и типам ошибок
  • проводить сравнительные эксперименты с составом данных, чтобы проверять, какие данные действительно помогают модели, а какие можно исключить или отправить на доработку
  • анализировать ошибки модели и переводить их в конкретные запросы на данные: что дособирать, что переразметить, что удалить, что добавить в выборку
  • готовить теги задач, объектов, окружений и ошибок, эталонные наборы примеров, правила контроля качества разметки и критерии приемки
  • исследовать, как изменения камер, конфигурации робота, калибровки или других сенсоров влияют на качество данных и результат модели
  • готовить краткие технические отчеты: гипотеза, данные, метрики, ограничения, выводы, рекомендуемые изменения для релиза датасета или плана сбора данных.

Требования

  • 3+ года опыта в data analysis, data engineering, ML engineering, applied ML или близкой области
  • уверенный Python: pandas/polars, numpy, visualization, notebooks, batch data processing
  • SQL и опыт работы с большими датасетами, manifests, metadata, dashboards или analytics pipelines
  • понимание экспериментального дизайна: ablations, контрольные группы, statistical reliability, интерпретация метрик
  • базовое понимание ML training / eval loop и связи состава данных с метриками модели
  • умение анализировать мультимодальные данные: видео, временные ряды, actions, task metadata, labels
  • способность переводить наблюдения из данных и ошибок модели в actionable recommendations
  • навыки работы с генеративными AI-моделями, опыт создания AI-агентов и использование их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах
  • инструментальное владение Ai для анализа, генерации и автоматизации
  • хорошая письменная коммуникация для отчетов, журналов решений и постановки задач смежным командам.

Будет плюсом:

  • опыт с robot learning, VLA, imitation learning, RL, CV/VLM datasets или embodied AI
  • опыт с W&B, MLflow, Hydra, experiment tracking, dataset lineage
  • опыт с annotation QA, active learning, data curation, anomaly detection или quality scoring
  • понимание domain shift, camera shift, embodiment gap, task transfer и data-centric AI.

Условия

  • дружный и высококвалифицированный коллектив
  • уникальные масштабные проекты, работа в приоритетном направлении
  • достойная заработная плата (оклад + годовая премия)
  • современные рабочие места и программное обеспечение
  • ДМС, корпоративная пенсионная программа, страхование от несчастных случаев, социальные гарантии, корпоративные мероприятия
  • высокий уровень корпоративной культуры
  • работа в офисе (г. Москва, метро Автозаводская)
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
Brand Analytics

ML Lead

Brand Analytics

  • Москва

  • Не указана

Ecom.tech
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

РТЛабс

AI-Engineer

РТЛабс

  • Москва

  • Не указана

АНО ЦИСМ
  • Москва

  • Не указана

АНО ЦИСМ
  • Москва

  • Не указана

Банк Русский Стандарт
  • Москва

  • Не указана

Мамба
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Домклик
  • Москва

  • Не указана

СОГАЗ
  • Москва

  • Не указана

Инго Банк

Data Engineer

Инго Банк

  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию