Сейчас мы ищем Staff Machine Learning Engineer к нашему партнеру «Даталаб».
Даталаб — IT-компания, которая разрабатывает сложные решения в области искусственного интеллекта и предоставляет услуги аутстаффинга профессиональных команд. Наши клиенты — технологические компании по всему миру. Мы строим долгосрочные и надежные отношения как с заказчиками, так и с нашими специалистами.
Мы ищем исключительного ML-инженера уровня Staff для технического лидерства в развитии нашей платформы Text-to-SQL и Programming Language Processing. В этой роли вы будете определять техническую стратегию, архитектуру ML-систем и руководить командой в создании SOTA-решений для обработки естественного языка. Это позиция для технического лидера, способного совмещать hands-on разработку с стратегическим видением развития ML-направления.
Что предстоит делать:
Определение технической стратегии ML-направления на горизонте 1-2 года
Архитектурные решения для ML-платформы и инфраструктуры
Установление стандартов качества кода, экспериментов и ML-практик
Техническое менторство команды из 5-10 ML-инженеров
Cross-функциональное взаимодействие с продуктом, инженерами и data science
Стратегическое развитие направления:
Построение roadmap исследований и разработки в области Text-to-SQL/NL2SQL и PLP
Оценка и внедрение новых технологий и подходов (LLM, RAG, multi-modal models)
Балансирование между исследованиями и продуктовыми задачами
Формирование технического видения развития NLP-capabilities компании
Hands-on разработка и исследования:
Личное участие в наиболее сложных и критичных задачах
Прототипирование инновационных решений и proof-of-concepts
Instruct tuning больших языковых моделей для специализированных задач
Оптимизация существующих пайплайнов для достижения production-уровня качества и скорости
Инфраструктура и масштабирование:
Дизайн ML-инфраструктуры для обучения и инференса моделей в масштабе
Оптимизация затрат на вычислительные ресурсы
Построение MLOps-процессов: версионирование моделей, A/B тестирование, мониторинг
Обеспечение надежности ML-систем в production
Ждем от тебя:
7+ лет в Machine Learning, из них минимум 3 года в NLP/LLM
Опыт технического лидерства команд от 5 человек
Proven track record успешного вывода ML-моделей в production с измеримым бизнес-импактом
Глубокая экспертиза в современном NLP:
Архитектуры трансформеров (BERT, GPT, T5, LLaMA и их вариации)
Методы обучения: pre-training, fine-tuning, RLHF, DPO, instruction tuning
PEFT-методы: LoRA, QLoRA, P-tuning, Prefix tuning, IA3
Промпт-инжиниринг и in-context learning
Технические навыки
Масштабное обучение моделей:
Распределенное обучение (DeepSpeed, FSDP, Megatron-LM)
Оптимизация памяти и вычислений
Mixed precision training, gradient checkpointing
Production ML:
Оптимизация инференса (quantization, distillation, pruning)
Serving frameworks (vLLM, TGI, Triton)
Мониторинг и debugging ML-систем
Инфраструктура:
Kubernetes, Docker для ML workloads
Опыт работы с облачными платформами (AWS, GCP, Yandex Cloud)
ML-платформы (MLflow, W&B, ClearML)
Специализированные знания
Глубокое понимание задач Text-to-SQL и semantic parsing
Опыт работы с бенчмарками Spider, CoSQL, WikiSQL, BIRD
Знание современных подходов:
RAG для улучшения качества генерации
Chain-of-thought и другие техники reasoning
Schema linking и entity disambiguation
SQL экспертиза и понимание различных диалектов
Лидерские качества
Стратегическое мышление и умение видеть big picture
Коммуникационные навыки для работы с техническими и нетехническими стейкхолдерами
Опыт найма и построения высокоэффективных команд
Умение принимать решения в условиях неопределенности
Баланс между перфекционизмом и прагматизмом
Дополнительные преимущества
Публикации на топовых конференциях (NeurIPS, ICML, ACL, EMNLP)
Вклад в open-source проекты в области NLP
Опыт работы с моделями 70B+ параметров
Участие в создании датасетов или бенчмарков, принятых сообществом
Опыт работы в BigTech или ведущих AI-лабораториях
PhD в области CS/ML/NLP (не обязательно, но приветствуется)
Москва
Не указана