Москва
Разработка унифицированного API инференса, абстрагирующего команды Data Science от особенностей GPU и рантаймов. Коммерческий опыт разработки на Go или Java...
Проектировать и разрабатывать высоконагруженные сервисы для инференса ML-моделей в облачной среде. Оптимизировать выполнение моделей на GPU: batching, управление GPU...