Предлагаем:
официальное оформление с первого рабочего дня;
заработная плата 210 000 рублей на руки;
график работы 5/2 с 9 до 18;
офис м. Нагатинская/м. Верхние Котлы;
компенсация питания;
полный социальный пакет.
Чем предстоит заниматься:
проектирование, адаптация и реализация архитектуры LLM под требования продукта, балансировка между качеством генерации, скоростью и потреблением ресурсов;
настройка, запуск и контроль распределённых тренировочных пайплайнов: конфигурирование гиперпараметров, управление кластерами, мониторинг стабильности и анализ метрик обучения;
тесное взаимодействие с Data Engineering командой: приём, валидация и подготовка обучающих корпусов, контроль качества данных, обратная связь по фильтрам и токенизации;
обеспечение качества, безопасности и стабильности моделей на всех этапах жизненного цикла, от прототипа до production-эксплуатации и итеративных улучшений.
Ожидаем:
глубокое понимание архитектур современных языковых моделей (Transformer, MoE, RoPE, attention variants), опыт модификации или разработки кастомных архитектур под специфические задачи;
свободное владение Python и PyTorch/JAX, уверенная работа с распределённым обучением: DeepSpeed, Megatron-LM, FSDP, оптимизация multi-GPU/multi-node конфигураций;
навыки настройки и управления процессом обучения LLM: подбор гиперпараметров, learning rate scheduling, checkpointing, gradient accumulation, mixed precision (BF16/FP8);
опыт запуска, мониторинга и отладки тренировочных процессов: W&B, MLflow, TensorBoard, обработка OOM, fault tolerance, логирование метрик и анализ сходимости;
наличие успешного опыта обучения или дообучения LLM «под ключ» — от приёма данных и пре-трена до production-развёртывания, мониторинга и поддержки.