Python Developer (Triton Inference Server, gRPC)

Смарт Телеком

Python Developer (Triton Inference Server, gRPC)

Описание вакансии

Смарт Телеком — один из крупнейших универсальных операторов Санкт-Петербурга, входящий в пятерку лидеров. В масштабах России компания входит в 30 телекоммуникационных организаций.

С 1996 года помогаем бизнесу строить надежные коммуникации: от интернета и связи до интегрированных решений. Доверие тысяч клиентов — наш главный актив.

Текущий проект на базе искусственного интеллекта — голосовые AI-ассистенты с автоматизацией.


О проекте

Разработка микросервиса потокового синтеза речи (TTS) для голосовых ассистентов на базе NVIDIA Triton Inference Server и модели синтеза голоса.


Критически важные навыки:

1. NVIDIA Triton Inference Server

  • Опыт развертывания и настройки Triton Inference Server
  • Понимание model repository, config.pbtxt
  • Работа с dynamic batching, model instances
  • Знание backend'ов (PyTorch, ONNX, TensorRT)
  • Это основной компонент проекта!

2. Python (3.10+)

  • Опыт разработки на Python от 3 лет
  • Asyncio и асинхронное программирование
  • Работа с PyTorch моделями
  • FastAPI

3. gRPC

  • Опыт разработки gRPC сервисов на Python
  • Понимание protobuf
  • Работа со streaming (server-side streaming)
  • Интеграция с Triton через gRPC
  • Основной протокол взаимодействия!

4. ML/AI базовые знания:

  • Понимание работы нейронных сетей
  • Опыт работы с PyTorch
  • Базовое понимание TTS (Text-to-Speech) или обработки аудио

5. Docker & Linux:

  • Опыт работы с Docker
  • Уверенное владение Linux
  • Понимание работы GPU в контейнерах (nvidia-docker)

7. Git:

  • Опыт работы с Git/GitLab
  • Понимание Git Flow или аналогичных workflow

Желательные навыки (nice to have)

  • Опыт работы с моделями синтеза речи (VITS, Tacotron)
  • Voice cloning / speaker embeddings
  • Prometheus, Grafana (мониторинг)
  • Опыт оптимизации inference (TensorRT, ONNX)
  • Опыт работы с high-load системами

Задачи на проекте

  1. Развертывание Triton Inference Server
  2. Разработка Python микросервиса
  3. Оптимизация производительности
  4. Запуск в тестовую эксплуатацию

Технологический стек

Backend:

  • Python 3.10+
  • NVIDIA Triton Inference Server
  • gRPC (primary protocol)
  • PyTorch

Infrastructure:

  • Docker
  • GPU: NVIDIA RTX 5090 (32 GB VRAM)
  • Linux (Ubuntu 26)
  • GitLab (VPN доступ)

Что мы предоставляем

Детальную техническую спецификацию проекта
Доступ к GitLab по VPN
Доступ к серверу с GPU для разработки и тестирования
Поддержку и консультации по бизнес-логике
Четкие критерии приемки


Результат проекта

MVP включает:

  • Рабочий микросервис TTS с потоковым синтезом
  • Поддержка русского и английского языков
  • Система клонирования голосов
  • Graceful reload механизм
  • Мониторинг и метрики
  • Документация (техническая + эксплуатационная)
  • Покрытие тестами

После MVP:

  • Обсуждаем условия постоянного сопровождения
  • Возможность участия в развитии проекта
  • Долгосрочное сотрудничество

Как откликнуться

Отправьте в отклике

  1. Резюме с описанием опыта работы с:

    • NVIDIA Triton Inference Server (обязательно!)
    • gRPC на Python (обязательно!)
  2. Примеры проектов:

    • GitHub/GitLab репозитории
    • Описание проектов с Triton/gRPC
    • Портфолио (если есть)
  3. Ваши ожидания:

    • Ваша вилка по проекту
    • Доступность (когда можете начать)
  4. Краткое сопроводительное письмо:

    • Почему вам интересен проект
    • Релевантный опыт
    • Вопросы по проекту (если есть)
Навыки
  • Python
  • machinelearning
  • tts
  • PyTorch
  • inference
  • gpu
  • gRPC
  • FastAPI
  • LLM
  • Claude code
  • Windsurf
  • Triton server
Посмотреть контакты работодателя

Похожие вакансии

БМикро
  • Санкт-Петербург

  • Не указана

Рекомендуем
Brainpower Group
  • Санкт-Петербург

  • Не указана

Рекомендуем
Дмитриев Станислав Алексеевич

Инженер ПТО (Разработка ППР)

Дмитриев Станислав Алексеевич

  • Санкт-Петербург

  • Не указана

Рекомендуем

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию