GigaChat Vision Team — делаем все связанное с vision модальностью: VLM (Pretrain, SFT, RL), Video, Streaming Video, Mobile Vision, VLM OCR, Document Intelligence, VLA, Embodied VLA. Обучаем на тысячах A100/H100, инференсим на всем - от кластеров до мобильных устройств.
Мы ищем эксперта, который глубоко понимает поведение LLM и умеет целенаправленно управлять им через обучение.
Для кандидата действительно высокого уровня компенсация не ограничена рамками — готовы платить за реальную экспертизу.
Роль:
Работа сфокусирована на обучении и адаптации LLM под реальные продуктовые задачи.
Ищем специалиста с эволюцией от classic NLP и LSTM, через BERT, к современным LLM, и практическим опытом их обучения в последние годы.
Задачи:
• Fine-tuning LLM под сложные сценарии
• cross-domain generalization, trajectory fine-tuning, behavior cloning
• Применение и выбор методов обучения под задачу
• SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT, knowledge distillation
• Работа с данными: сбор, очистка, анализ влияния на поведение модели
• Выбор архитектур и pre-trained моделей
• Полный цикл обучения: pre-training, fine-tuning, alignment, inference
• Подготовка моделей к продакшену
Требования
• 3+ лет практического обучения LLM
• Опыт SFT, DPO, PPO / GRPO, RLHF / RLAIF, PEFT
• Глубокое понимание NLP, transformers и поведения LLM
• Понимание RL и classic ML
• HuggingFace: transformers, datasets, peft, trl
• Коммерческая разработка с нуля
• Общий опыт от 6 лет
Будет плюсом
• Research / публикации
• Соревнования, хакатоны
• ШАД / Школа 21
Условия
• Уровень компенсации обсуждаем индивидуально, ориентируемся на сильных кандидатов
• Полностью удалённо, без привязки к стране
• Сложные задачи, сильная команда, минимум бюрократии
Freedx HQ Management Services FZE
Москва
Не указана
Star Leads
Москва
Не указана