Мы в Сбере запускаем новый проект - Embodied AI. Наша цель - стать центром компетенций по использованию новых модальностей при обучении роботов и VLA, упростить сбор подобных данных, а также разработать собственную модель, способную эффективно работать с самыми разными модальностями, включая запахи и прикосновения.
Обязанности
- Участвовать в подготовке и разметке мультимодальных данных для обучения VLA‑и RL‑моделей (визуальные, тактильные, возможно, аудио/запахи через прокси‑сенсоры).
- Реализовывать и адаптировать типичные алгоритмы RL/IL (DQN, PPO, SAC, поведенческое клонирование) по готовым статьям/репозиториям под задачи команды.
- Проводить эксперименты: запускать обучения, анализировать и интерпретировать полученные результаты.
Требования
- так же Студент старших курсов или выпускник (магистратура/специалитет) технического вуза (МФТИ, ВШЭ, ИТМО, МГУ и т. д.).
- Уверенное владение математическим аппаратом: математический анализ, линейная алгебра, теория вероятностей.
- Уверенное знание Python, базовые знания Linux и Git, понимание основ Classic ML и DL (Deep Learning), опыт работы с PyTorch.
- Понимание основ RL: MDP, функция ценности, политика, epsilongreedy, advantage estimation; знакомство хотя бы с одним классическим алгоритмом (DQN/PPO/SAC) из курсов/проектов.
Будет плюсом:
- Опыт работы с симуляторами и робототехникой: MuJoCo, Isaac Gym, PyBullet, Habitat, Webots или реальные манипуляторы/мобильные роботы
- Знакомство с мультимодальными моделями: CLIP, Flamingo‑подобные архитектуры, VLA‑подходы
- Участие в ML‑соревнованиях (Kaggle, хакатоны); контрибьюты в open‑source проекты.
Условия
- Комфортный современный офис рядом с м. Кутузовская
- Гибридный формат работы
- Корпоративный спортзал и зоны отдыха
- Более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- Программа адаптации и помощь руководителя на старте
- Вознаграждение за рекомендацию друзей в команду Сбера.