Франция
Опыт разработки production ML-сервисов от 4 лет. Опыт написания custom Triton/CUDA kernels. Опыт с Triton Inference Server.
Разработка и оптимизация систем развёртывания ML-моделей. Повышение производительности, снижение latency и оптимизация затрат. Администрирование инфраструктуры поиска и обработки данных.