Команда проекта занимается разработкой платформы, предоставляющей пользователям современные инструменты для потребления, хранения, преобразования и визуализации данных в соответствии с практиками DataOps.
Сейчас мы находимся в поиске NLP Engineer для работы в опытной команде. Присоединяйся к нам и участвуй в разработке для телеком проекта.
Твои задачи:
- Формулировать гипотезы для улучшения NLP/PLP моделей и алгоритмов, планировать исследовательские эксперименты с выводами
- Проводить эксперименты, писать код, подготавливать датасеты и бенчмарки, проводить замеры и анализировать результаты
- Обучать модели на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей
- Взаимодействовать с прод-командой для интеграции моделей и алгоритмов в продакшн
Мы ждем от тебя:
- Знание в DL, с упором в современный NLP и трансформеры
- Умение формулировать эксперименты с научной строгостью, обосновывать их, проводить самостоятельно и делать выводы
- Опыт обучения трансформеров
- Опыт распределенного обучения моделей (deepspeed, fsdp, torch.distributed, accelerate)
- Знание стандартных библиотек для DL и NLP (PyTorch и библиотеки Huggingface)
- Знание lora/p-tune и других peft/sft-подходов
- Знакомство с Spider/CoSQL
Что мы обеспечим:
- Работа в гибкой методологии разработки
- Возможность расширить свою экспертизу, используя современный стек технологий
- Сессия профессионального развития персонала дважды в год, результатом которой является план индивидуального развития каждого сотрудника
- Поездки на конференции и тренинги за счет компании, внутренние семинары, внутренние митапы, мы очень любим учиться новому
- Сообщества по интересам: Лига Спорта, Лига Интеллекта, Лига Шахмат, CyberЛига, ЛигаPerformance, Лига Добра, Лига Кошатников, а также возможность организовать свое сообщество и получить поддержку от компании
- Корпоративная культура со своими ценностями и традициями, в которой каждый человек чувствует себя частью команды
- Новая техника для комфортной работы