Senior Machine Learning Engineer

Описание вакансии

Сейчас мы ищем Senior Machine Learning Engineer к нашему партнеру «Даталаб».

Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.

Мы ищем опытного ML-инженера уровня Senior для работы над cutting-edge задачами в области Natural Language Processing, с фокусом на Text-to-SQL и Programming Language Processing. Это уникальная возможность работать с современными языковыми моделями и внести вклад в развитие технологий обработки естественного языка.

Что предстоит делать:

Основной фокус работы:

Instruct tuning моделей для решения задач Text-to-SQL/NL2SQL и Programming Language Processing (PLP)
Разработка и оптимизация алгоритмов преобразования естественного языка в SQL-запросы

Исследования и разработка:

Дизайн и планирование экспериментов с научной строгостью
Формулировка и тестирование гипотез для улучшения NLP/PLP моделей
Проведение исследовательских экспериментов с последующим анализом результатов
Написание production-ready кода для ML-пайплайнов

Работа с данными и моделями:

Подготовка и курирование датасетов для обучения
Разработка и поддержка бенчмарков для оценки качества моделей
Обучение моделей на GPU-кластерах, включая:
- Обучение моделей с нуля
- Fine-tuning open-source моделей (LLaMA, Mistral, Qwen и др.)
- Оптимизация процессов обучения

Внедрение и коллаборация:

Тесное взаимодействие с продуктовой командой для интеграции моделей в production
Оптимизация моделей для развертывания в промышленной эксплуатации
Участие в code review и менторинг junior-специалистов

Развитие экспертизы:

Мониторинг SOTA-решений в области NLP
Изучение и анализ актуальных научных публикаций

Предложение инновационных подходов и направлений исследований

Ждем от тебя:

Обязательные навыки:

Глубокие теоретические знания в области Deep Learning с акцентом на современный NLP и архитектуру Transformers
Практический опыт обучения трансформеров (минимум 2 года)
Экспертиза в распределенном обучении: DeepSpeed, FSDP, torch.distributed, Accelerate
Владение ключевыми инструментами:
- PyTorch (продвинутый уровень)
- Экосистема Hugging Face (transformers, datasets, tokenizers, peft)
Опыт с PEFT-методами: LoRA, P-tuning, QLoRA, другие parameter-efficient подходы
Знакомство с бенчмарками: Spider, CoSQL, WikiSQL
Научный подход: умение формулировать эксперименты, обосновывать гипотезы и делать корректные выводы
Python: уверенное владение, clean code, опыт оптимизации