Сейчас мы ищем Senior Machine Learning Engineer к нашему партнеру «Даталаб».
Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.
Мы ищем опытного ML-инженера уровня Senior для работы над cutting-edge задачами в области Natural Language Processing, с фокусом на Text-to-SQL и Programming Language Processing. Это уникальная возможность работать с современными языковыми моделями и внести вклад в развитие технологий обработки естественного языка.
Что предстоит делать:
Основной фокус работы:
Instruct tuning моделей для решения задач Text-to-SQL/NL2SQL и Programming Language Processing (PLP)
Разработка и оптимизация алгоритмов преобразования естественного языка в SQL-запросы
Исследования и разработка:
Дизайн и планирование экспериментов с научной строгостью
Формулировка и тестирование гипотез для улучшения NLP/PLP моделей
Проведение исследовательских экспериментов с последующим анализом результатов
Написание production-ready кода для ML-пайплайнов
Работа с данными и моделями:
Подготовка и курирование датасетов для обучения
Разработка и поддержка бенчмарков для оценки качества моделей
Обучение моделей на GPU-кластерах, включая:
Обучение моделей с нуля
Fine-tuning open-source моделей (LLaMA, Mistral, Qwen и др.)
Оптимизация процессов обучения
Внедрение и коллаборация:
Тесное взаимодействие с продуктовой командой для интеграции моделей в production
Оптимизация моделей для развертывания в промышленной эксплуатации
Участие в code review и менторинг junior-специалистов
Развитие экспертизы:
Мониторинг SOTA-решений в области NLP
Изучение и анализ актуальных научных публикаций
Предложение инновационных подходов и направлений исследований
Ждем от тебя:
Обязательные навыки:
Глубокие теоретические знания в области Deep Learning с акцентом на современный NLP и архитектуру Transformers
Практический опыт обучения трансформеров (минимум 2 года)
Экспертиза в распределенном обучении: DeepSpeed, FSDP, torch.distributed, Accelerate
Владение ключевыми инструментами:
PyTorch (продвинутый уровень)
Экосистема Hugging Face (transformers, datasets, tokenizers, peft)
Опыт с PEFT-методами: LoRA, P-tuning, QLoRA, другие parameter-efficient подходы
Знакомство с бенчмарками: Spider, CoSQL, WikiSQL
Научный подход: умение формулировать эксперименты, обосновывать гипотезы и делать корректные выводы
Python: уверенное владение, clean code, опыт оптимизации
Дополнительные преимущества:
Опыт работы на аналогичной позиции в продуктовой компании
Участие в ML-соревнованиях (Kaggle, NeurIPS competitions)
Присутствие в лидербордах по NLP/PLP задачам
Научные публикации уровня A/A*, Q1 конференций
Опыт обучения больших моделей (7B+ параметров) на кластерах
Знание SQL и опыт работы с базами данных
Опыт работы с LLM API (OpenAI, Anthropic, YandexGPT)
Москва
Не указана
Техвилл (ООО Автомакон)
Москва
до 470000 RUR