ML Engineer (Fine-tuning LLM)

VICTORY group

ML Engineer (Fine-tuning LLM)

Описание вакансии

Добрый день!

Мы "VICTORY group" являемся одним из лидирующих рекламных агентств России. Наши клиенты — это крупнейшие автохолдинги, застройщики, медицинские центры и другие компании различных отраслей.

Более 15 000 компаний каждый месяц доверяют нам!

Ведём работу по двум направлениям:

1. Управление репутацией

Мы более пяти лет работаем в сфере репутационного маркетинга в интернете.
Лучше всех в России понимаем, как работать с негативом.
Помогаем в создании положительного образа компании с гарантией.

2. Лидогенерация

Можем найти заинтересованных клиентов в любой сфере.
Применяем инновационные решения в интернет-маркетинге, показываем лучшие результаты на рынке.

Обязанности:

  • Проведение полного цикла fine-tuning LLM: от анализа данных до production-внедрения;
  • Создание и разметка качественных датасетов для обучения диалоговых моделей;
  • Проведение экспериментов с различными методами fine-tuning (LoRA, QLoRA, full fine-tuning);
  • Оптимизация гиперпараметров и архитектуры моделей для улучшения качества диалогов;
  • Разработка и настройка ML-пайплайнов для обучения и мониторинга моделей;
  • Интеграция моделей в production-систему голосовых звонков;
  • Анализ и обработка corner cases для улучшения обработки сложных диалогов;
  • Настройка inference-серверов (vLLM/TGI) и оптимизация latency;
  • Внедрение MLOps практик: CI/CD, мониторинг качества моделей, версионирование;
  • Тесное взаимодействие с командой ML-инженеров по методологии Scrum.

Требования:

  • Fine-tuning LLM: 2+ года практического опыта, минимум 2 успешных production проекта;
  • Создание датасетов: умение разрабатывать качественные датасеты для fine-tuning с нуля;
  • PyTorch: уверенное владение выше среднего уровня;
  • Голосовые модели: опыт работы с LLM для voice assistants или conversational AI;
  • Теория ML: глубокое понимание теории машинного обучения;
  • Production опыт: локальное развертывание и inference обученных моделей;
  • Наличие актуального портфолио с описанием минимум 2-х реальных продакшн-проектов.

Будет плюсом:

  • Фреймворки для fine-tuning: Hugging Face, Axolotl, LLaMA Factory, LoRA, QLoRA;
  • MLOps инструменты: MLflow, Weights & Biases, TensorBoard;
  • RAG системы: Retrieval-Augmented Generation для улучшения контекста;
  • RLHF опыт: Reinforcement Learning from Human Feedback;
  • Open-source вклад: публикации на Hugging Face, GitHub проекты;
  • Публикации: статьи, исследования, конференции по ML/NLP.

Условия:

  • ​​​​​​​​​​​​​​​​​​​​​Удаленный формат работы, полный рабочий день;
  • Уровень заработной платы от 200 000 рублей (обсуждаем индивидуально на собеседовании);
  • Перспектива профессионального и карьерного роста.
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию