Команда AI-Hub Блока Финансы создает и поддерживает платформу для разработки, хранения и исполнения ML-моделей и AI-агентов. Мы обеспечиваем централизованные API для взаимодействия с моделями и инструменты разработки, соответствующие требованиям архитектуры и кибербезопасности Сбера.
В связи с развитием направления пакетной обработки данных, мы ищем специалиста, который возьмет на себя развитие инфраструктуры для эффективного исполнения моделей на Hadoop/Spark и интеграции с корпоративными витринами данных.
- Глубокий опыт в MLOps: уверенное владение инструментами пакетного исполнения ML-моделей (Hadoop, PySpark). Опыт вывода online ML-сервисов и online inference моделей (REST API)
- Практический опыт работы с корпоративными витринами данных и системами подписок на данные
- Опыт работы с PostgreSQL, OpenSearch, Kafka
- Опыт работы с Docker и Kubernetes
- Уверенное владение Python для автоматизации и разработки ETL-процессов
- Опыт работы с Jenkins и/или ArgoCD, понимание концепции pipeline-as-code
- Готовность одновременно работать с инфраструктурой, кодом пайплайнов и процессами (DevOps подход)
Будет плюсом:
- Опыт промышленной разработки сервисов на Python (FastAPI и др.)
- Базовое понимание оркестрации (Helm)
- Опыт работы с векторными базами данных (Chroma, Elasticsearch, аналоги)
- Практика GitOps и управление инфраструктурой через Git
- Опыт разработки microservices architecture для ML-приложений
- Навыки написания и поддержки технической документации