Проводить техническое исследование новых подходов и фреймворков для эффективной эксплуатации LLM в production;
Оптимизировать производительность моделей: latency, throughput, cost-efficiency (quantization, distillation, speculative decoding и др.).
Требования:
Опыт работы с LLM (инференс, дообучение, fine-tuning, RAG и пр.) - не менее 2-х лет;
Уверенное владение Python и основными ML-библиотеками (PyTorch, Transformers, accelerate и т.п.);
Опыт проектирования LLM-агентов или production-систем на их основе. (LangChain, LangGraph и т.п.);
Опыт вывода решений на основе LLM в пром (vLLM, SGLang).
Условия:
Стабильный и прозрачный доход: размер заработной платы обсуждается по итогам собеседования;
Полностью удаленная работа;
Пятидневная рабочая неделя;
Среда для твоего неизбежного развития — сложные и интересные задачи, регулярные тренинги и вебинары, доступ к бесплатным корпоративным библиотекам Альпины и бизнес-изданий, скидки на курсы иностранных языков;
Забота о твоем здоровье — программа ДМС со стоматологией и обслуживанием в лучших клиниках города, скидки на абонементы в фитнес-клубы, неформальные спортивные сообщества;
Возможности для разнообразного досуга — скидки на услуги туристических агентств, продукты питания, рестораны и бары, магазины и салоны красоты.