Минск
Метро: КупаловскаяНаша компания специализируется на разработке передовых решений для арбитража трафика. Мы гордимся эффективными и хорошо отлаженными процессами, которые обеспечивают высокую производительность на всех этапах работы сотрудников. Наш коллектив состоит из опытных специалистов в области трафика, разработки и управления, что позволяет нам успешно реализовывать даже самые сложные проекты. Мы создали внутри компании атмосферу сотрудничества и взаимопомощи, что способствует успешной работе и профессиональному развитию.
Компания уже 6 лет на рынке и продолжает активно развиваться, имея множество успешно завершенных проектов. Мы гарантируем полную занятость, комфортные условия труда и возможности для профессионального роста.
Что нужно делать:
• Настраивать и адаптировать крупные языковые модели (MythoMax, Mistral, Llama) под продуктовые задачи компании.
• Разрабатывать системные промпты, диалоговые сценарии и архитектуру persona для диалоговых персонажей.
• Создавать и поддерживать пайплайны Speech-to-Text (Whisper, Google Speech, Vosk) и Text-to-Speech с уникальными голосами персонажей.
• Проектировать и реализовывать Character Memory / State Engine - структуру памяти персонажа, которая хранит состояние, историю взаимодействий, характеристики и контекст.
• Моделировать эмоции и контекст в диалогах, обеспечивать адаптивность поведения модели.
• Интегрировать аудио- и voice-компоненты между frontend и backend системами.
• Оптимизировать ML-модели: квантование (4bit, 8bit), кеширование, ускорение инференса, оптимизация производительности.
Что ждем от кандидата:
• Опыт работы с LLM-моделями (GPT-подобные, Mistral, Llama и др.), включая настройку и адаптацию под конкретные сценарии.
• Глубокие знания в области NLP, intent recognition и построения диалоговых систем.
• Практический опыт интеграции Speech-to-Text и Text-to-Speech решений.
• Владение Python, фреймворками PyTorch / TensorFlow.
• Опыт реализации Character Memory / State Engine или аналогичных структур контекста.
• Навыки моделирования эмоций и контекста в генеративных системах.
• Понимание архитектур трансформеров, fine-tuning, quantization.
• Умение оптимизировать и масштабировать ML-пайплайны под production-нагрузку.
Мы предлагаем:
• Удалённую работу фулл-тайм в стандартном (5/2) гибком графике;
• Оплата 2 раза в месяц (по желанию);
• 28 календарных дней отпуск + больничные, а также 1 day off в месяц;
• Возможность обучаться новому за счёт компании.