Москва
Метро: Библиотека им.ЛенинаМеждународная AL компания специализирующийся на разработке передовых ИИ-технологий для обработки фото и видео, генерации визуального контента и интерактивных визуальных решений, серьезный игрок в области генеративного контента, сочетая технологии искусственного интеллекта с визуальными эффектами и пользовательскими приложениями в поиске Inference Engineer.
О роли
В роли Inference Engineer в GlamAI вы будете отвечать за оптимизацию нейронных сетей в реальных production-условиях — от профилирования и анализа производительности до использования готовых решений и разработки кастомных оптимизаций при необходимости.
Если вы реально ускоряли ML-модели и вам интересно работать на стыке высокоуровневого машинного обучения и низкоуровневой GPU-оптимизации, команда будет рада знакомству.
Основные обязанности
Профилирование, бенчмаркинг и выявление узких мест в пайплайнах инференса нейросетей
Портирование, адаптация и оптимизация моделей для on-device inference
(задержки, потребление памяти, батареи, тепловая стабильность)
Оптимизация серверного инференса с точки зрения пропускной способности и стоимости
Совместная работа с ML-исследователями над архитектурами моделей с учетом эффективности инференса
Требования
Опыт:
Практический опыт оптимизации инференса глубоких нейросетей (mobile / edge)
Опыт работы хотя бы с одним из инструментов:
Core ML / TFLite / ONNX Runtime / TensorRT
Metal / Vulkan / OpenCL / OpenGL / CUDA / Triton
Технические навыки:
Глубокое понимание архитектуры GPU / NPU и модели их выполнения
Знание техник оптимизации инференса:
квантование, слияние операторов, оптимизация вычислительных графов
Условия
Конкурентная заработная плата и возможности карьерного роста
Компенсация фитнеса
Работа над инновационными AI-продуктами
Сильная инженерная команда и стартап-культура
Полное обеспечение необходимым оборудованием
Преимущества работы в нашей компании :
Работа в сильной команде маркетинговых и технологических специалистов из ведущих компаний индустрии: Lensa, Picsart, Viber, AIRI, Яндекс.
Поддержка инвесторов с успешной историей экзитов, включая продажу Looksery и AI Factory компании Snap за $150 млн и $166 млн соответственно.
Быстрорастущая компания с $50 млн ARR и более 250 000 довольных клиентов в США и Европе.
Участие в инновационных AI-проектах в динамичной и быстро меняющейся стартап-среде.