- обучение собственных gpt-like языковых моделей (QWEN, LLAMA и аналоги) с нуля;
- развитие и продолжение существующих экспериментов по обучению моделей;
- работа с полным циклом: сбор и подготовка текстовых датасетов, обучение векторизатора, подготовка векторизированных версий текстов;
- инициализация и обучение моделей (в т.ч. с нуля), подбор архитектуры и гиперпараметров;
- оценка качества моделей, проведение экспериментов и итеративное улучшение результатов.
- опыт обучения gpt-like LLM-моделей (QWEN, LLAMA и аналоги) с нуля (приоритетное требование);
- глубокое понимание процесса обучения: инициализация весов, подготовка датасетов, тренировочный пайплайн;
- опыт работы с векторизаторами и подготовкой текстовых данных;
- сильный Python и опыт с ML-фреймворками (PyTorch и др.);
- понимание distributed training и работы с GPU;
- как альтернатива: сильный опыт качественного файн-тюнинга предобученных gpt-like моделей;
Санкт-Петербург
Не указана
Москва
до 220000 RUR
Swiss Medica XXI century
Санкт-Петербург
до 220000 RUR
Контакт-центр АльфаЛайн
Санкт-Петербург
до 1000 USD
Санкт-Петербург
до 400000 RUR
Санкт-Петербург
до 400000 RUR
Эксперт Инжиниринг
Санкт-Петербург
от 120000 RUR