Каменка (Ленинградская область)
Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, обучение на нескольких GPU. Коммерческий опыт с RL ( RLHF...
Разработка и масштабирование тонкой настройки обучения с подкреплением для LLM, включая подходы RLHF, RLVR и другие современные методы.