Стартап, разрабатывающий foundation-модель для финансовых рынков на стыке LLM и time series, ищет к себе в команду Compiler/C++ инженера.
Для того чтобы обучать и запускать такую модель, создаётся MLIR-based компилятор и полный программный стек под новый аппаратный ускоритель с не-фон Неймановской архитектурой. Это железо оптимизировано для высокопроизводительного инференса и, в будущем, обучения, с архитектурой, где тысячи параллельных вычислительных блоков работают без узкого места классической CPU/GPU-модели.
Основные задачи
- Разработка MLIR-based компилятора под архитектуру ускорителя.
- Интеграция поддержки нового железа в ML-фреймворки (PyTorch, TensorFlow).
- Проектирование и реализация высокоуровневого API для инференса и обучения, поверх нативного hardware API.
- Работа с низкоуровневым C++ API: конфигурация ядер, загрузка и выполнение кода, оптимизация вычислений.
- Профилирование и оптимизация производительности на архитектурах с тысячами параллельных ядер.
Требования
- Сильные навыки программирования на C/C++.
- Английский — B1+.
- Опыт разработки под архитектуры, отличные от CPU (GPU, DSP и т.д.).
- Опыт разработки компиляторов (LLVM, MLIR).
- Опыт профилирования и анализа производительности.
- Опыт работы с популярными ML-фреймворками (TensorFlow, PyTorch и др.).
- Опыт работы с API для параллельных вычислений (CUDA/OpenCL, SYCL, OpenACC/OpenMP).
Условия
- Работа в молодом исследовательском стартапе с амбициозной задачей - разработкой foundation-модели и собственного аппаратного ускорителя.
- Возможность повлиять на архитектуру и ключевые технические решения проекта.
- Готовность гибко обсуждать компенсацию для сильного кандидата, так как это одна из ключевых ролей.
- Формат работы: полностью удалённо, либо возможность работать в локациях, где открыты юр.лица компании: в Нидерландах или Сербии.
- Долгосрочная перспектива участия в создании уникального продукта на стыке ML и hardware.