Senior STT & TTS Engineer (Uzbek voice)

InFinBank

Senior STT & TTS Engineer (Uzbek voice)

Ташкент, улица Тараса Шевченко, 1

Описание вакансии

Рады сообщить: Мы в поисках ведущего специалиста, который будет работать над системами автоматического распознавания речи (ASR) и синтеза речи (TTS). Ожидаем от будущего кандидата участие в выборе, обучении моделей, а также в настройке пайплайнов для inference в real-time.

Скоуп тасков:
• Разработка и оптимизация моделей ASR и/или TTS (на базе open-source и кастомных решений)
• Исследование и внедрение моделей на базе Whisper, NeMo, Vosk, FastSpeech, Tacotron и др.
• Обработка аудиоданных: препроцессинг, очистка, аугментации
• Оптимизация latency, обеспечение real-time inference
• Интеграция моделей в сервисы (API, gRPC, FastAPI)
• Мониторинг качества (WER, MOS и др.), A/B тестирование
• Обучение/Дообучение Моделей на данных
• Менторство в рамках команды

Требования:
• Опыт работы с задачами ASR и/или TTS в ML-продуктах
• Уверенное знание Python, PyTorch / TensorFlow
• Опыт с open-source решениями (Whisper, ESPNet, Mozilla TTS, Coqui, etc.)
• Знание алгоритмов работы с аудио: FFT, MelSpectrogram, MFCC и т.п.
• Навыки оптимизации inference (ONNX, quantization, streaming)
• Понимание задач real-time распознавания
• Опыт от 2-3 года в ML или DS проектах с голосом

Будет плюсом:
• Опыт развертывания моделей в реальном времени (в т.ч. на GPU / edge)
• Опыт с NeMo, HuggingFace Audio, Transformers (TTS/ASR модули)
• Работа с облачными STT/TTS API и кастомизация поверх них

АКБ "InFinBank" открывает широкие профессиональные перспективы для своих сотрудников:
• Корпоративное обучение за счёт работодателя
• Гибкость формата работы
• Возможность влияния на развитие проектов одного из крупнейшего банка UZ с 4+ млн. пользователей
• Команда, где ценится экспертиза, инициативность и инженерная культура
• Возможность карьерного роста
• Доход выше среднего по локальному рынку труда и индивидуально обсуждаем с каждым отдельным специалистом

Навыки
  • ASR
  • Speech-To-Text
  • Text-To-Speech
  • Python
  • TensorFlow
  • open-source
Посмотреть контакты работодателя

Адрес

Похожие вакансии

BUSINESS ROBOTS AI

Prompt-инженер AI | MLL

BUSINESS ROBOTS AI

Полный день
  • Ташкент

  • до 12000000 UZS

Рекомендуем
HamkorBank
Полный день
  • Ташкент

  • до 12000000 UZS

Рекомендуем
TBC
Полный день
  • Ташкент

  • до 12000000 UZS

Рекомендуем
CONSORT TAS
Полный день
  • Ташкент

  • до 12000000 UZS

NOVA RENESSANS

ML-инженер

NOVA RENESSANS

Полный день
  • Ташкент

  • до 10000000 UZS

АО Асакабанк
Полный день
  • Ташкент

  • до 10000000 UZS

Полный день
  • Ташкент

  • до 10000000 UZS

Middle DevOps Engineer

Alif Uzbekistan

Полный день
  • Ташкент

  • до 10000000 UZS

ATEX AI
Удаленная работа
  • Ташкент

  • от 5000 USD

MUK Computers

Инженер Juniper

MUK Computers

Полный день
  • Ташкент

  • от 5000 USD

FE LLC Huawei Tech Investment Tashkent

IT Engineer & Operator

FE LLC Huawei Tech Investment Tashkent

Полный день
  • Ташкент

  • от 5000 USD

Капиталбанк
Полный день
  • Ташкент

  • от 5000 USD

DevOps-инженер

TAYYAB FINANCE MIKROMOLIYA TASHKILOTI

Полный день
  • Ташкент

  • от 5000 USD

HamkorBank
Полный день
  • Ташкент

  • от 5000 USD

HamkorBank
Удаленная работа
  • Ташкент

  • от 5000 USD

EY Uzbekistan
Полный день
  • Ташкент

  • от 5000 USD

Компания по рефинансированию ипотеки Узбекистана

Инженер по системной интеграции и сетям

Компания по рефинансированию ипотеки Узбекистана

Полный день
  • Ташкент

  • от 5000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию