Лимасол
Проектировать и развивать архитектуру для ASR (Automatic Speech Recognition) и Audio Processing (VAD, Denoising, Speech Enhancement)
Внедрять решения для минимизации задержек (Low Latency) и повышать пропускную способность, работать с квантованием, прунингом и компиляцией моделей под GPU
Выстраивать процессы сбора и подготовки данных для Low-resource языков, формировать стратегии разметки, автоматизировать валидацию и работу с аугментацией
Разрабатывать и поддерживать сервисы для инференса моделей (Python/C++), интеграция с backend-системой
Экспериментировать с новыми архитектурами (Transformer-based, Conformer, Transducer и др.), адаптация SOTA-статей под бизнес-задачи
Опыт в ML/DL от 5 лет, с фокусом на обработку звука последние 2 года
Глубокое понимание архитектур нейросетей для работы со звуком (Conformer, Wav2Vec, Whisper и аналоги)
Уверенное владение Python и опыт написания продакшн-кода (OOP, паттерны, асинхронность)
Опыт оптимизации моделей для Real-time (знание ONNX, TensorRT или OpenVINO)
Умение работать с "грязными" данными и выстраивать пайплайны их очистки
Английский язык на уровне чтения документации и коммуникации (B1+)
Будет плюсом:
Работа в продуктовом AI-стартапе с собственными LLM-технологиями
Возможность влиять на архитектуру и качество ключевых AI-систем
Команда инженеров, которые любят эксперименты и быстрые результаты
Гибкий график и формат работы (релокация в офис на Кипре (после ИС (6 месяцев)/удалённо из любой точки мира)
Дополнительные условия обсуждаются индивидуально в зависимости от локации кандидата