Senior ML engineer (офис)

Совкомбанк Технологии

Senior ML engineer (офис)

Описание вакансии

Проект: участие в разработке и внедрении масштабируемой, отказоустойчивой ML-платформы для обработки речи и семантического анализа, включающей автоматическое распознавание речи (ASR), синтез речи (TTS), языковые модели (LLM), а также RAG-решения для генерации и извлечения информации. Проект ориентирован на production-эксплуатацию в высоконагруженной среде с низкой задержкой, включая интеграцию с VoIP-платформами и автоматизацию бизнес-процессов.
Стек: PyTorch, Transformers, LLM, RAG, Airflow, Kubeflow, Grafana

Обязанности:

  • Разработка, дообучение и оптимизация ML-моделей: LLM, ASR (CTC, RNNT), TTS, RAG-систем на основе трансформеров
  • Развертывание и настройка высокопроизводительного инференса с использованием Triton Inference Server и TensorRT
  • Построение и поддержка ML-пайплайнов: ETL, препроцессинг, обучение, валидация, A/B тестирование
  • Обеспечение CI/CD в ML: автоматизация тестирования, версионирование моделей, мониторинг дрейфа данных и качества Интеграция ML-моделей в production-системы через gRPC, Kafka, REST (FastAPI)
  • Разработка запросов к PostgreSQL, работа с векторными (Qdrant) и графовыми БД для семантического поиска и связей
  • Построение отказоустойчивых микросервисных систем: контейнеризация (Docker), оркестрация (Kubernetes), масштабирование Интеграция с VoIP-платформами, обработка аудиопотоков в реальном времени
  • Автоматизация бизнес-процессов с использованием n8n
  • Наставничество, декомпозиция сложных задач, код-ревью, участие в R&D и внедрении новых технологий
  • Обеспечение production-ready решений с акцентом на производительность, масштабируемость и отказоустойчивость
Требования:
  • Глубокие знания в ML/AI, включая обучение и дообучение моделей (LLM, RAG, трансформеры, кластеризация)
  • Опыт работы с Triton Inference Server (развертывание, оптимизация, BLS, TensorRT)
  • Практика в ML Ops: CI/CD для ML, мониторинг моделей, управление пайплайнами (Airflow, Kubeflow, Grafana)
  • Умение развертывать и дообучать ASR, STT, TTS модели (например CTC, RNNT)
  • Навыки работы с GRPC, Kafka, Redis, PostgreSQL (включая оптимизацию запросов)
  • Программирование: Golang, Java, асинхронный/многопоточный Python (asyncio, multiprocessing)
  • Глубокие знания библиотек Numpy, Pandas, sklearn, FastAPi
  • Глубокие знания Pytorch
  • Способность декомпозировать сложные задачи и обучать команду
  • Ориентация на production-ready решения с учетом масштабируемости и отказоустойчивости
  • Готовность к R&D и внедрению новых технологий

Будет плюсом:

  • Умение выстраивать высоконагруженные системы (микросервисы, брокеры сообщений)
  • Практика в DevOps (Docker, k8s) в том числе для ML-развертываний
  • Опыт работы с векторными БД (например Qdrant) для RAG-решений
  • Опыт работы с Графовыми БД. Знание WebRTC, SIP для интеграции голосовых решений (например, VoIP-платформы)
  • Опыт с n8n для автоматизации бизнес-процессов
Мы предлагаем:
  • Работу в аккредитованной ИТ-компании
  • Сильную команду и опытных наставников
  • Поддерживаем профессиональное развитие каждого: есть внутренний учебный центр и развитая система наставничества, активно участвуем во внешних мероприятиях и проводим собственные, оплачиваем внешнее обучение, участие в конференциях и курсы английского языка
  • Расширенный портфель бенефитов (ДМС со стоматологией, фитнес и внутренние спортивные мероприятия, коворкинги в Сочи и на Алтае, материальную поддержку в различных жизненных ситуациях, скидки на страховые коробочные продукты банка и партнеров, многое другое)
  • Вовлеченность, комфорт и свобода самовыражения, приходи – с нами будет интересно!
Посмотреть контакты работодателя

Похожие вакансии

ЭВРИКА, Санкт-Петербург

Middle Machine Learning инженер (NLP)

ЭВРИКА, Санкт-Петербург

Полный день
  • Санкт-Петербург

  • Не указана

Рекомендуем
Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
ZeBrains
Удаленная работа
  • Санкт-Петербург

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Санкт-Петербург

  • Не указана

Полный день
  • Санкт-Петербург

  • Не указана

ЕДИНЫЙ ЦУПИС
Полный день
  • Санкт-Петербург

  • Не указана

2ГИС
Удаленная работа
  • Санкт-Петербург

  • Не указана

Altenar
Удаленная работа
  • Санкт-Петербург

  • Не указана

AdRiver
Полный день
  • Санкт-Петербург

  • Не указана

Радиофид
Полный день
  • Санкт-Петербург

  • от 130000 RUR

СБЕР

Data Engineer

СБЕР

Полный день
  • Санкт-Петербург

  • от 130000 RUR

LuckyGroup

Data Engineer

LuckyGroup

Полный день
  • Санкт-Петербург

  • от 130000 RUR

ЦКТ
Удаленная работа
  • Санкт-Петербург

  • от 130000 RUR

Леста Игры
Полный день
  • Санкт-Петербург

  • от 130000 RUR

Osla
Полный день
  • Санкт-Петербург

  • от 250000 RUR

Лента, федеральная розничная сеть

Старший инженер больших данных

Лента, федеральная розничная сеть

Полный день
  • Санкт-Петербург

  • от 250000 RUR

Полный день
  • Санкт-Петербург

  • до 350000 RUR

СБЕР
Полный день
  • Санкт-Петербург

  • до 350000 RUR

Норд Клан
Удаленная работа
  • Санкт-Петербург

  • до 350000 RUR

Датаджайл
Полный день
  • Санкт-Петербург

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию