Мы создаём передовой блокчейн для распределенных вычислений в сфере ИИ. Мы ищем инженера, специализирующегося на инфраструктуре и производительности вывода машинного обучения. Ваша задача — сделать крупномасштабный вывод ИИ быстрым, экономически эффективным и безопасным в среде гетерогенных GPU-узлов, включая конфиденциальные и минимизированные по уровню доверия среды.
Обязанности:
AI / Inference: PyTorch, ONNX; vLLM, SGLang; Triton Inference Server, TensorRT; CUDA, NVIDIA NGC;
Знания в области систем машинного обучения: Архитектура Transformer, механизм внимания; KV-кэш, токенизация, эмбеддинги; Линейная алгебра для повышения производительности машинного обучения;
Языки программирования: Python, Rust.
Будет плюсом:
— Понимание основ блокчейна;
— Опыт работы с распределенными системами / P2P-сетями;
— Масштабируемые системы машинного обучения в производственной среде;
— Сильный технический английский.