Мы аккредитованная IT-компания Экосистемы СберБанка. Развиваем инновационные решения, исследуем все ключевые метрики и показатели для бизнеса и госсектора.
В настоящий момент у нас открыта вакансия «Data Scientist - Computer Vision».
Если вы увлечены разработкой высокопроизводительных систем inference для Computer Vision, умеете оптимизировать ML-модели для production и готовы работать с современным стеком технологий (Triton, FastAPI, Kubernetes, Prometheus, Kafka), мы будем рады видеть вас в нашей команде
Задачи:
- Проектирование и оптимизация inference-систем: разработка на базе Triton Inference Server, оптимизация моделей CV (квантизация, прунинг, дистилляция) с использованием Triton Model Navigator, конвертация моделей из Torch в TorchScript, ONNX, TensorRT.
- Высокопроизводительная обработка видео: разработка систем для эффективной работы с видеопотоками (RTSP, RTMP, HLS), оптимизация кодирования/декодирования через GPU-ускорение (NVENC/NVDEC), создание пайплайнов на базе GStreamer и FFmpeg, интеграция механизмов синхронизации для мультипоточного видео.
- Настройка и администрирование Linux-инфраструктуры с GPU: установка и конфигурация драйверов и компонентов NVIDIA (CUDA, Drivers, CUDA Toolkit, Container Toolkit), оптимизация операционной системы.
- Оркестрация и мониторинг: настройка Kubernetes для управления компонентами системы, интеграция Prometheus для мониторинга производительности, создание отказоустойчивых систем для непрерывной обработки.
- Оптимизация производительности: имплементация мультипроцессорной и асинхронной обработки, оптимизация использования GPU-ресурсов, разработка стратегий батчинга и балансировки нагрузки в многопоточных системах.
- Интеграция и документация: разработка адаптеров на FastAPI и Kafka для взаимодействия с внешними системами, стандартизация и документирование архитектуры решений.
Наши ожидания:
- Опыт с ML и Computer Vision:
- Опыт работы в области Computer Vision от 3 лет
- Глубокое знание PyTorch и принципов обучения моделей DL
- Практический опыт оптимизации моделей CV (TensorRT, ONNX Runtime)
- Инференс и видеообработка:
- Обязательный опыт с Triton Inference Server (развертывание, оптимизация)
- Глубокое знание OpenCV для обработки видео и изображений
- Опыт работы с множеством видеопотоков и их синхронизацией
- Понимание форматов видео, кодеков (H.264/H.265) и протоколов передачи
- Программирование и оптимизация:
- Уверенное владение Python с фокусом на асинхронность, мультипроцессорность и оптимизацию памяти
- Опыт решения проблем с производительностью в системах видеообработки (потери кадров, задержки)
- Опыт с NVIDIA SDK для аппаратного ускорения кодирования/декодирования (NVENC/NVDEC)
- Разработка API и интеграции:
- Опыт разработки высоконагруженных API на FastAPI
- Навыки эффективной обработки видеопотоков (RTSP, MJPEG, RTMP, HLS)
- Понимание на высоком уровне архитектуры и принципов работы систем inference
Будет плюсом:
- Архитектура и DevOps:
- Опыт проектирования, разработки микросервисных архитектур для ML-систем и настройки CI/CD пайплайнов
- Продвинутое использование Kubernetes для автоматического масштабирования ML-сервисов и управления GPU-ресурсами
- Комплексный мониторинг на базе Prometheus/Grafana и оптимизация Docker-контейнеров для ML-задач
- Оптимизация производительности:
- Знание gRPC для создания высокопроизводительных компонентов и эффективного сетевого взаимодействия
- Опыт профилирования Python-кода и оптимизации систем в условиях ограниченных ресурсов
- Глубокий опыт работы с Triton Model Navigator для конвертации и тонкой настройки моделей
- Видеообработка и дополнительные навыки:
- Практический опыт с GStreamer/FFmpeg и DeepStream для высокопроизводительной обработки видеопотоков
- Разработка адаптивных систем инференса с динамической балансировкой нагрузки
- Опыт построения event-driven архитектур с использованием Kafka
- Навыки в других сферах ИИ:
- Практический опыт с OpenVINO для оптимизации и развертывания моделей на CPU/Intel GPU
- Использование vLLM для высокопроизводительного инференса LLM в production с поддержкой динамического батчинга
- Интеграция BentoML для стандартизации упаковки ML-сервисов
- Настройка MLflow для трекинга экспериментов, управления версиями моделей и оркестрации ML-пайплайнов
- Автоматизация end-to-end AI workflow: от данных и тренировок до мониторинга продакшн-моделей
- Опыт работы с LangChain и LlamaIndex для построения RAG-систем
- Профессиональные качества:
- Способность эффективно коммуницировать технические концепции и находить баланс между теорией и практикой.
- Проактивный подход к решению проблем производительности и стремление к освоению новых технологий.
Мы предлагаем:
Оформление в штат по ТК РФ (бессрочный трудовой договор).
Работа в аккредитованной IT-компании, сопутствующие льготы.
Бонус по итогам работы (годовой).
ДМС, в т.ч. для родных по программе со-оплаты.
Скидки и льготы от СберБанка (льготная ипотека, кредитные программы) и партнеров.
Развитие и расширение компетенций внутри команды.
Местоположение команды – Москва.
График работы: гибрид.