Inference Engineer

Hi, Rockits!

Inference Engineer

Москва

Описание вакансии

Ищем Inference инженера в международную продуктовую AI-компанию, которая уже более 4 лет разрабатывает приложение для редактирования фото и видео на базе компьютерного зрения и искусственного интеллекта. Продукт активно растёт, используется пользователями в США и Европе, а команда работает над тем, чтобы сложные AI-модели работали быстро и стабильно в реальном продукте.

Чем предстоит заниматься:

  • Оптимизировать инференс нейросетей в продакшене: искать узкие места, измерять производительность, ускорять работу моделей

  • Адаптировать и оптимизировать модели для запуска на мобильных устройствах (latency, потребление памяти, батарея, стабильность)

  • Улучшать серверный инференс: повышать пропускную способность и снижать стоимость вычислений

  • Работать совместно с ML-исследователями над архитектурой моделей с учётом их эффективности в реальном использовании

  • Внедрять готовые решения и, при необходимости, разрабатывать кастомные оптимизации под конкретные сценарии

Кого мы ищем:

  • Коммерческий опыт оптимизации инференса нейросетей (mobile / edge / server)

  • Глубокий практический опыт хотя бы с одним из инструментов: Core ML / TFLite / ONNX Runtime / TensorRT или низкоуровневые технологии: Metal / Vulkan / OpenCL / OpenGL / CUDA / Triton

  • Понимание архитектуры GPU / NPU и принципов их работы

  • Опыт применения техник оптимизации инференса.

  • Будет плюсом: Опыт on-device inference (особенно iOS), опыт работы с моделями компьютерного зрения (фото / видео)

Что предлагает компания:

  • Гибридный график работы в Тбилиси (помощь по релокации предоставляется);

  • Конкурентный доход (вилка обсуждается индивидуально);

  • Возможность работать с реальными AI-продуктами, которые используются сотнями тысяч пользователей ($50M ARR and 250K+ пользователей);

  • Работа в сильной инженерной команде в быстрорастущем стартапе, сотрудники компании имели опыт работы в топ-компаниях отрасли, таких как Lensa, Picsart, Viber, AIRI, Yandex.

Навыки
  • Computer Vision
  • Python
  • OpenGL
Посмотреть контакты работодателя

Адрес

Похожие вакансии

САТЕЛ, Группа компаний

Computer Vision Engineer

САТЕЛ, Группа компаний

Полный день
  • Москва

  • Не указана

Рекомендуем

CV Engineer - Team Lead (Senior)/Инженер машинного обучения/Компьютерного зрения

Промышленное оборудование с ИИ-решениями для автоматизации

Полный день
  • Москва

  • Не указана

Рекомендуем
Национальная система платежных карт

ML-engineer

Национальная система платежных карт

Полный день
  • Москва

  • Не указана

Рекомендуем
Национальный исследовательский университет Высшая школа экономики

ML-инженер

Национальный исследовательский университет Высшая школа экономики

Полный день
  • Москва

  • Не указана

ТехВилл
Полный день
  • Москва

  • Не указана

Нейросетевые решения
Удаленная работа
  • Москва

  • Не указана

ТОП КЕЙС
Полный день
  • Москва

  • Не указана

Полный день
  • Москва

  • до 290000 RUR

СберОбразование

Large Language Model Engineer (Middle)

СберОбразование

Полный день
  • Москва

  • до 290000 RUR

Сбер Бизнес Софт

Data Science / ML Engineer / NLP Engineer

Сбер Бизнес Софт

Удаленная работа
  • Москва

  • до 290000 RUR

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

ML-инженер (LLM)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • до 290000 RUR

АльфаСтрахование

Главный Data Engineer

АльфаСтрахование

Удаленная работа
  • Москва

  • до 290000 RUR

СБЕР
Удаленная работа
  • Москва

  • до 290000 RUR

МАГНИТ, Розничная сеть

ML Engineer Search

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • до 290000 RUR

Soft Media Group

Junior ML engineer

Soft Media Group

Полный день
  • Москва

  • от 100000 RUR

СБЕР
Удаленная работа
  • Москва

  • от 100000 RUR

Яндекс
Полный день
  • Москва

  • от 100000 RUR

Криптонит

ML-инженер

Криптонит

Полный день
  • Москва

  • от 100000 RUR

СБЕР
Полный день
  • Москва

  • от 100000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию