Мы разрабатываем мультиагентную систему для автономного мониторинга ИИ-агентов в проде. Наша цель-повысить скорость, точность и надежность процессов оценки рисков ИИ-решений, что напрямую влияет на эффективность работы Банка. Система будет осуществлять автономный мониторинг ИИ-агентов в реальном времени с использованием передовых подходов к обнаружению аномалий.
Обязанности
Разработка ИИ-агентов:
- проектирование и реализация мультиагентной системы обнаружения аномалий
- создание агентов для автоматизации сквозного автономного мониторинга ИИ-агентов
- разработка ML моделей для детекции аномалий
- внедрение reinforcement learning для самообучающейся системы мониторинга.
Инженерия данных:
- построение ETL/ELT пайплайнов для обработки трассировок AI-агентов
- реализация stream processing для анализа данных в реальном времени
- работа с трейсами ИИ-агентов (Arize Phoenix, OpenAI и др.)
DevOps и инфраструктура:
- развертывание и поддержка production-инфраструктуры для мультиагентной системы
- настройка CI/CD пайплайнов для ML систем мониторинга
- автоматизация развертывания и масштабирования агентов с помощью Kubernetes
- реализация Infrastructure as Code для воспроизводимости окружения
- мониторинг и обеспечение надежности работы системы 24/7.
Интеграция и коллаборация:
- тесное кросс-функциональное взаимодействие с другими командами для внедрения агентов в прод среду
- интеграция с существующими MLOps-инструментами.
Требования
- продвинутый Python: опыт написания чистого, модульного кода, знание принципов PEP-8, SOLID и т.п..
- практический опыт с LLM: fine-tuning, RAG, prompt engineering
- опыт разработки AI-агентов: понимание multi-agent систем (AutoGen, CrewAI и т.п.), reinforcement learning
- знание инструментов для работы с LLM (LangChain, LangFuse, LangSmith, Hugging Face и т.п.)
- знание подходов GitOps для управления ML инфраструктурой
- опыт интеграции с MLOps-инструментами (MLflow, Airflow).
Желательно:
- опыт работы с трейсами ИИ-агентов (Arize Phoenix, OpenAI и др.)
- опыт работы с stream processing (Kafka, Flink)
- знание observability стека (OpenTelemetry, Prometheus, Grafana)
- знание ML-стэка: PyTorch, Lightning, Transformers, Diffusers и т.п.
Условия
- комфортный современный офис рядом с м.Кутузовская
- гибридный формат работы
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- регулярные митапы и развитое DS-community
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.