Москва
Глубокая экспертиза в архитектуре и инференсе больших языковых моделей. Понимание устройства моделей (трансформеры, BERT, LLM и т.д.).
Возглавить разработку и оптимизацию инфраструктуры инференса LLM‑моделей, обеспечивая минимальную задержку и высокую пропускную способность для внутренних приложений и сервисов.