NLP/LLM engineer Middle+

KVINT

NLP/LLM engineer Middle+

Описание вакансии

Компания KVINT – ведущая компания по разработке и внедрению голосовых роботов/виртуальных ассистентов.

Основной продукт – голосовые виртуальные ассистенты, способные заменить живого человека на телефоне на входящих и исходящих звонках, во время которых роботы полностью имитируют живое человеческое общение по телефону, и люди не догадываются, что общаются с роботом.
Решение построено на нейронных моделях, содержит технологии синтеза и распознавания речи, обработки естественного языка и управления диалогом.
Мы ищем человека, который хочет принимать участие в создании крупного и интересного проекта, обладает высокой квалификацией и готов работать в команде. Если вы уверены в своих способностях и ищете новые вызовы, мы будем рады видеть вас в нашей команде!

Основные задачи:


— Разработка и оптимизация моделей LLM для голосовых ассистентов, включая fine-tuning opensource LLM для обработки звонков на русском языке, с адаптацией моделей под специфику телефонного домена.
— Подбор и дообучение моделей LLM для оптимального использования ресурсов, улучшения производительности и точности инференса.
— Проведение стресс-тестирования моделей для гарантии надежности и производительности в высоконагруженной среде.
— Разработка и интеграция решений по созданию и обновлению базы знаний на основе документов различных типов, с прицелом на телефонные сценарии.
— Эффективное взаимодействие с командой для согласования приоритетов и своевременного решения критически важных задач, блокирующих развитие продукта.
— Направление разработки сервисов, связанных с LLM, в соответствии с общими целями и потребностями продукта.

Требования:

  • Уверенные знания Python (Data Science), PyTorch, Docker.
  • Опыт работы с LLM: сбор и подготовка данных, последовательное дообучение, владение различными инструментами и фреймворками для обучения (TRL, torchrun, DeepSpeed и др.)
  • Глубокое понимание DL и NLP для работы с текстовыми данными.
  • Опыт работы с векторными базами данных.
  • Опыт применения методов квантизации моделей и практик ускорения инференса.
  • Опыт подготовки LLM к продакшн-развертыванию на фреймворке vLLM или аналогичных фреймворках.
  • Приветствуется опыт с омнимоделями (текст+звук).

Условия:

— Независимость и самостоятельность в реализации задач, поощрение инициативы, гибкий менеджмент и отсутствие бюрократии.
— Работа в команде профессионалов, обучение в рамках предметной области.
— Крупный перспективный проект федерального масштаба с возможностями для профессионального развития.
— Конкурентная заработная плата.
— Возможность работать на полной удаленке.
— Интересные задачи и самые современные технологии.
— Зарплатные ожидания обсуждаются на собеседовании и всегда принимаются во внимание при оффере.
Навыки
  • Python
  • data science
  • PyTorch
  • Docker
  • LLM
  • Английский язык
  • NLP
  • Нейронные сети
  • RAG
  • HuggingFace
  • ML
  • Machine Learning
Посмотреть контакты работодателя

Похожие вакансии

Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
Бизнес Технологии

NLP/AI-разработчик

Бизнес Технологии

Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

Рекомендуем
YADRO
Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

Рекомендуем
Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

ZeBrains
Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

Достависта. Сервис курьерской доставки

Senior DevOps Engineer

Достависта. Сервис курьерской доставки

Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

Just AI
Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

2ГИС
Удаленная работа
  • Санкт-Петербург

  • от 150000 RUR

Лаборатория институционального проектного инжиниринга

AI/ML Engineer + Backend Developer

Лаборатория институционального проектного инжиниринга

Удаленная работа
  • Санкт-Петербург

  • от 300000 RUR

Sputnik8
Удаленная работа
  • Санкт-Петербург

  • от 300000 RUR

ЦКТ
Удаленная работа
  • Санкт-Петербург

  • от 300000 RUR

МОНЕТА

SRE инженер

МОНЕТА

Удаленная работа
  • Санкт-Петербург

  • до 190000 RUR

Kaiten
Удаленная работа
  • Санкт-Петербург

  • до 190000 RUR

Арго Медиа
Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

СП Солюшен

Senior Data Engineer

СП Солюшен

Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

ЦРТ | Группа компаний

Prompt-инженер / Аналитик LLM

ЦРТ | Группа компаний

Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

Grokhotov Studio
Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

Компания Индид

Senior QA Engineer

Компания Индид

Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

Первый Бит
Удаленная работа
  • Санкт-Петербург

  • от 260000 RUR

Агент Умный полис

DevOps-инженер

Агент Умный полис

Удаленная работа
  • Санкт-Петербург

  • от 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию