Проект: участие в разработке и внедрении масштабируемой, отказоустойчивой ML-платформы для обработки речи и семантического анализа, включающей автоматическое распознавание речи (ASR), синтез речи (TTS), языковые модели (LLM), а также RAG-решения для генерации и извлечения информации. Проект ориентирован на production-эксплуатацию в высоконагруженной среде с низкой задержкой, включая интеграцию с VoIP-платформами и автоматизацию бизнес-процессов.
Стек: PyTorch, Transformers, LLM, RAG, Airflow, Kubeflow, Grafana
Обязанности:
- Разработка, дообучение и оптимизация ML-моделей: LLM, ASR (CTC, RNNT), TTS, RAG-систем на основе трансформеров
- Развертывание и настройка высокопроизводительного инференса с использованием Triton Inference Server и TensorRT
- Построение и поддержка ML-пайплайнов: ETL, препроцессинг, обучение, валидация, A/B тестирование
- Обеспечение CI/CD в ML: автоматизация тестирования, версионирование моделей, мониторинг дрейфа данных и качества Интеграция ML-моделей в production-системы через gRPC, Kafka, REST (FastAPI)
- Разработка запросов к PostgreSQL, работа с векторными (Qdrant) и графовыми БД для семантического поиска и связей
- Построение отказоустойчивых микросервисных систем: контейнеризация (Docker), оркестрация (Kubernetes), масштабирование Интеграция с VoIP-платформами, обработка аудиопотоков в реальном времени
- Автоматизация бизнес-процессов с использованием n8n
- Наставничество, декомпозиция сложных задач, код-ревью, участие в R&D и внедрении новых технологий
- Обеспечение production-ready решений с акцентом на производительность, масштабируемость и отказоустойчивость
Требования: - Глубокие знания в ML/AI, включая обучение и дообучение моделей (LLM, RAG, трансформеры, кластеризация)
- Опыт работы с Triton Inference Server (развертывание, оптимизация, BLS, TensorRT)
- Практика в ML Ops: CI/CD для ML, мониторинг моделей, управление пайплайнами (Airflow, Kubeflow, Grafana)
- Умение развертывать и дообучать ASR, STT, TTS модели (например CTC, RNNT)
- Навыки работы с GRPC, Kafka, Redis, PostgreSQL (включая оптимизацию запросов)
- Программирование: Golang, Java, асинхронный/многопоточный Python (asyncio, multiprocessing)
- Глубокие знания библиотек Numpy, Pandas, sklearn, FastAPi
- Глубокие знания Pytorch
- Способность декомпозировать сложные задачи и обучать команду
- Ориентация на production-ready решения с учетом масштабируемости и отказоустойчивости
- Готовность к R&D и внедрению новых технологий
Будет плюсом:
- Умение выстраивать высоконагруженные системы (микросервисы, брокеры сообщений)
- Практика в DevOps (Docker, k8s) в том числе для ML-развертываний
- Опыт работы с векторными БД (например Qdrant) для RAG-решений
- Опыт работы с Графовыми БД. Знание WebRTC, SIP для интеграции голосовых решений (например, VoIP-платформы)
- Опыт с n8n для автоматизации бизнес-процессов
Мы предлагаем: - Работу в аккредитованной ИТ-компании
- Сильную команду и опытных наставников
- Поддерживаем профессиональное развитие каждого: есть внутренний учебный центр и развитая система наставничества, активно участвуем во внешних мероприятиях и проводим собственные, оплачиваем внешнее обучение, участие в конференциях и курсы английского языка
- Расширенный портфель бенефитов (ДМС со стоматологией, фитнес и внутренние спортивные мероприятия, коворкинги в Сочи и на Алтае, материальную поддержку в различных жизненных ситуациях, скидки на страховые коробочные продукты банка и партнеров, многое другое)
- Вовлеченность, комфорт и свобода самовыражения, приходи – с нами будет интересно!