Добрый день!
 Мы "VICTORY group" являемся одним из лидирующих рекламных агентств России. Наши клиенты — это крупнейшие автохолдинги, застройщики, медицинские центры и другие компании различных отраслей.
 Более 15 000 компаний каждый месяц доверяют нам!
 Ведём работу по двум направлениям:
 1. Управление репутацией
 Мы более пяти лет работаем в сфере репутационного маркетинга в интернете.
Лучше всех в России понимаем, как работать с негативом.
Помогаем в создании положительного образа компании с гарантией.
 2. Лидогенерация
 Можем найти заинтересованных клиентов в любой сфере.
Применяем инновационные решения в интернет-маркетинге, показываем лучшие результаты на рынке.
 Обязанности:
  - Проведение полного цикла fine-tuning LLM: от анализа данных до production-внедрения;
- Создание и разметка качественных датасетов для обучения диалоговых моделей;
- Проведение экспериментов с различными методами fine-tuning (LoRA, QLoRA, full fine-tuning);
- Оптимизация гиперпараметров и архитектуры моделей для улучшения качества диалогов;
- Разработка и настройка ML-пайплайнов для обучения и мониторинга моделей;
- Интеграция моделей в production-систему голосовых звонков;
- Анализ и обработка corner cases для улучшения обработки сложных диалогов;
- Настройка inference-серверов (vLLM/TGI) и оптимизация latency;
- Внедрение MLOps практик: CI/CD, мониторинг качества моделей, версионирование;
- Тесное взаимодействие с командой ML-инженеров по методологии Scrum.
Требования:
  - Fine-tuning LLM: 2+ года практического опыта, минимум 2 успешных production проекта;
- Создание датасетов: умение разрабатывать качественные датасеты для fine-tuning с нуля;
- PyTorch: уверенное владение выше среднего уровня;
- Голосовые модели: опыт работы с LLM для voice assistants или conversational AI;
- Теория ML: глубокое понимание теории машинного обучения;
- Production опыт: локальное развертывание и inference обученных моделей;
- Наличие актуального портфолио с описанием минимум 2-х реальных продакшн-проектов.
Будет плюсом:
  - Фреймворки для fine-tuning: Hugging Face, Axolotl, LLaMA Factory, LoRA, QLoRA;
- MLOps инструменты: MLflow, Weights & Biases, TensorBoard;
- RAG системы: Retrieval-Augmented Generation для улучшения контекста;
- RLHF опыт: Reinforcement Learning from Human Feedback;
- Open-source вклад: публикации на Hugging Face, GitHub проекты;
- Публикации: статьи, исследования, конференции по ML/NLP.
Условия:
  - Удаленный формат работы, полный рабочий день;
- Уровень заработной платы от 200 000 рублей (обсуждаем индивидуально на собеседовании);
- Перспектива профессионального и карьерного роста.