ML‑разработчик (Middle, Inference & MLOps)

Автономные Технологии

ML‑разработчик (Middle, Inference & MLOps)

Москва, Большая кольцевая линия, метро Народное Ополчение

Метро: Народное Ополчение

Описание вакансии

Автономные технологии — компания, которая разрабатывает инновационные решения, направленные на улучшение и совершенствование робототехники и технологий машинного обучения с применением передовых технологий искусственного интеллекта (ИИ) и уникальных инженерных решений.

Чем предстоит заниматься:

  • Приводить код DS к продакшен‑качеству: выполнять рефакторинг, выстраивать структуру проекта, писать тесты, настраивать логирование;

  • Конвертировать и компилировать модели в ONNX, TensorRT и RKNN; настраивать рантаймы под разные типы оборудования (CPU, GPU, edge‑устройства);

  • Оптимизировать инференс: проводить профилирование, устранять узкие места (ботлнеки), добавлять кастомные операции;

  • Использовать Triton Inference Server для деплоя и оркестрации моделей: настраивать конфигурации и маршрутизацию запросов;

  • Разрабатывать и поддерживать сервисы‑обвязки для инференса моделей;

  • Проводить нагрузочное тестирование сервисов инференса, выявлять узкие места и оптимизировать производительность;

  • Совместно с DevOps развёртывать модели: обеспечивать контейнеризацию (Docker), реализовывать базовый CI/CD;

  • Настраивать мониторинг и алертинг для моделей и сопутствующих сервисов: отслеживать метрики производительности, ошибок и деградации качества;

  • Развивать и настраивать внутреннюю MLOps‑платформу (ClearML): вести трекинг экспериментов, версионировать датасеты и модели, настраивать пайплайны.

Мы ожидаем:

  • Не менее 3 лет коммерческой разработки на Python; сформированную культуру разработки — в том числе навыки тестирования, логирования, типизации, соблюдения принципов чистого кода и выстраивания понятной структуры проектов;

  • Опыт работы с фреймворками машинного обучения (преимущественно PyTorch);

  • Понимание особенностей инференса моделей в продакшене: таких параметров, как latency и throughput, ограничений по памяти, а также принципов батчинга;

  • Практический опыт работы с ONNX и базовые знания TensorRT; готовность углубляться в вопросы оптимизации;

  • Опыт работы с Docker — в частности, сборки образов и базовой отладки контейнеров;

  • Опыт интеграции моделей в backend‑сервисы (микросервисы, API, очереди) — хотя бы на уровне совместной работы с командой;

  • Готовность осваивать Triton Inference Server и ClearML при отсутствии глубокого опыта: умение изучать документацию, экспериментировать и доводить задачи до результата;

  • Умение читать чужой код, аккуратно его дорабатывать и поддерживать коммуникацию с авторами (DS‑специалистами).

Будет плюсом:

  • Практический опыт деплоя моделей через Triton Inference Server;
  • Опыт работы с системами мониторинга (Prometheus, Grafana или аналогичные);
  • Опыт нагрузочного тестирования (locust);
  • Опыт оптимизации под конкретное железо (GPU‑серверы, edge‑устройства, специализированные ускорители);
  • Опыт работы в продуктовых командах, где ML‑модели живут в продакшене и регулярно обновляются.

Мы предлагаем:

  • Работу в аккредитованной IT-компании и Трудоустройство в соответствии с ТК РФ;
  • Систему наставничества и комфортную адаптацию в компании;
  • Возможности для профессионального и карьерного роста.
Навыки
  • Python
  • Hadoop
  • СУБД
Посмотреть контакты работодателя

Адрес

Похожие вакансии

СОГАЗ
  • Москва

  • Не указана

Рекомендуем
Riverstart (ООО Риверстарт)

ML-инженер (Middle)

Riverstart (ООО Риверстарт)

  • Москва

  • Не указана

Рекомендуем
АНО ЦИСМ
  • Москва

  • Не указана

Банк ПСБ

MLOps Engineer

Банк ПСБ

  • Москва

  • Не указана

АНО ЦИСМ
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Мамба
  • Москва

  • Не указана

Senior/Middle Python (GigaСhat Enterprise)

Салют для Бизнеса

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Аналитические программные решения

Middle Backend разработчик Python

Аналитические программные решения

  • Москва

  • до 250000 RUR

RWB (Wildberries & Russ)

Senior/Staff MLOps Engineer

RWB (Wildberries & Russ)

  • Москва

  • до 250000 RUR

СБЕР

Senior MLOPS

СБЕР

  • Москва

  • до 250000 RUR

Гоуланг Технологии

Golang Developer (Middle/Senior)

Гоуланг Технологии

  • Москва

  • до 250000 RUR

СБЕР
  • Москва

  • до 250000 RUR

Голд Тех
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию