Data Scientist (STT-системы)

Робот Мия

Data Scientist (STT-системы)

Новосибирск, Советский район, микрорайон Академгородок, Разъездная улица, 12

Описание вакансии

Привет!
Robotmia – продуктовая IT-компания, специализирующаяся на технологиях машинного обучения, искусственного интеллекта и понимания естественного языка. На рынке больше 7 лет и каждый год растет минимум в 2 раза.

Мы - сильное окружение из умных и приятных людей.
Наша команда ежедневно создает рабочее пространство, где каждый чувствует себя, как часть единого целого. Мы ценим самореализацию и инновации. У нас есть все возможности для раскрытия твоего потенциала, работая в команде профессионалов.

Основные продукты – "Голосовой ассистент" и "Модуль определения автоответчиков". С их помощью наши клиенты кратно увеличивают качество обслуживания своих пользователей и в разы сокращают расходы. А с операторов call-центров снимают скучную и рутинную работу.

Мы ищем Data Scientist для разработки и улучшения Speech-to-Text (STT) систем. Вам предстоит работать с обработкой аудиоданных, обучением и оптимизацией моделей распознавания речи, а также интеграцией решений в продукты компании.

Чем предстоит заниматься:

- Разработка, обучение и оптимизация нейросетевых моделей для распознавания речи

- Улучшение качества STT-моделей (метрики WER, CER), адаптация под разные акценты и шумные условия

- Оптимизация производительности модели для production (уменьшение задержек, сжатие моделей, квантование)

- Подготовка и обработка речевых данных (чистка, аугментация). Работа с речевыми датасетами

- Адаптация opensource-решений под текущие задачи

- Анализ ошибок модели и доработка алгоритмов для повышения точности распознавания

- Взаимодействие с инженерами для развертывания STT-моделей в в production-среду

- Разработка и внедрение методов акустического и языкового моделирования

- Тестирование и сравнение различных подходов к распознаванию речи

Мы ожидаем от тебя:

- Опыт работы 2+ года в Data Science / Machine Learning

- Уверенное владение Python и библиотеками (PyTorch/TensorFlow, Hugging Face, librosa, pandas, Kaldi)

- Понимание архитектур нейросетей, применяемых в ASR (CTC, RNN, CNN, Transformer-based)

- Знание методов акустической обработки сигналов (MFCC, спектрограммы, фильтрация)

- Базовые знания Docker, Git, MLflow (или аналогов)

- Базовые знания Linux и скриптовой автоматизации (bash/shell)

Будет плюсом:

- Опыт работы с opensource ASR-фреймворками (Whisper, DeepSpeech, Wav2Vec, ESPnet, NeMo)

- Опыт работы с ускорением ML-моделей (ONNX, TensorRT, quantization)

- Опыт работы с датасетами (LibriSpeech, Common Voice и др.)

- Опыт работы с речевыми данными (аугментация, feature extraction, работа с датасетами)

- Понимание оценки качества моделей (WER, CER, BLEU)

- Знание C++ для оптимизации инференса

- Опыт работы с распределенным обучением (DDP, FSDP)

- Знание методов аугментации аудио (speed perturbation, noise injection, SpecAugment)

- Умение дообучать и адаптировать модели под разные языки / акценты

- Знание методов акустического моделирования и языковых моделей (N-gram, RNN-LM)

Мы предлагаем:

  • Стабильную зарплату 2 раза в месяц, отпуска и больничные;

  • Креативную команду, которая решает инновационные задачи;

  • Удобный офис в Академгородке (2 мин. от станции Сеятель), возможный гибридный формат работы.

Мы не корпорация, наша стратегия основана на доверии и долгосрочных отношениях. Нам важно, чтобы новый человек был ответственным, вовлеченным и не боялся сложных задач.

Навыки
  • Python
  • NLP
  • Английский язык
  • MySQL
  • C/C++
  • ML
  • NLU
  • Clickhouse
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Т1
Удаленная работа
  • Новосибирск

  • Не указана

Рекомендуем
Загороднева Ирина Леонидовна

Data Engineer\Scientist

Загороднева Ирина Леонидовна

Полный день
  • Новосибирск

  • Не указана

Рекомендуем
Финтех Айкью

Data Engineer

Финтех Айкью

Удаленная работа
  • Новосибирск

  • Не указана

Рекомендуем
Т1
Удаленная работа
  • Новосибирск

  • Не указана

Финтех Айкью
Удаленная работа
  • Новосибирск

  • Не указана

Полный день
  • Новосибирск

  • Не указана

Эн+
Удаленная работа
  • Новосибирск

  • Не указана

СБЕР
Полный день
  • Новосибирск

  • Не указана

2ГИС
Удаленная работа
  • Новосибирск

  • Не указана

2ГИС
Удаленная работа
  • Новосибирск

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию