Мы разрабатываем платформу для управления физической сетью Сбера.
Ключевое направление — интеллектуальные сервисы на базе LLM и ML, которые обрабатывают структурированные данные, генерируют рекомендации и обеспечивают работу AI-агентов в продукте.
Вам предстоит строить отказоустойчивые backend-решения, интегрировать модели в production и формировать стандарты работы с AI в команде.
Задачи:
- проектировать и разрабатывать высокопроизводительные сервисы на Python FastAPI
- интегрировать LLM и ML-модели в продакшен, а именно: оркестрация AI-агентов, построение RAG-пайплайнов, управление контекстом, обработка потоковых ответов, оценка качества генерации
- работать с данными SQLAlchemy, проектировать схемы БД, оптимизировать запросы, кэширование, взаимодействие с векторными хранилищами
- разрабатывать и документировать API-контракты для фронтенда и внешних систем, обеспечение стабильности, безопасности и идемпотентности
- внедрять AI-инструменты в процесс разработки для генерации кода/тестов, автоматизации ревью, ускорения пайплайнов
- настраивать наблюдаемость через метрики, логи, трассировку и отлаживать production-инциденты
- вести кросс-функциональное взаимодействие в части совместной оптимизации пайплайнов данных, синхронизации с frontend по обработке AI-ответов и UX.
Мы ждем от тебя:
- от 3 лет коммерческой разработки на Python, уверенное владение FastAPI, SQLAlchemy, асинхронным программированием (asyncio, httpx/aiohttp)
- коммерческий опыт интеграции LLM (OpenAI, Anthropic, open-source модели через vLLM/Ollama) и фреймворков (LangChain, LlamaIndex, Haystack или кастомные обёртки)
- понимание принципов работы ML-пайплайнов, опыт деплоя и масштабирования моделей/сервисов в production
- опыт проектирования REST/gRPC API, работа с брокерами сообщений (Kafka/RabbitMQ), кэшем (Redis), очередью задач (Celery/Dramatiq)
- активное использование AI-инструментов в разработке (Cursor, GitHub Copilot, LLM API) с пониманием, как встраивать их в CI/CD и рабочий процесс без потери качества кода
- умение самостоятельно разбираться в новых доменах, писать читаемый и тестируемый код, проводить конструктивные код-ревью
- Базовые знания Docker, CI/CD, принципов наблюдаемости и безопасности API.
Будет плюсом
- опыт работы с векторными БД (Qdrant, Weaviate, Milvus, pgvector) и построения production-ready RAG-систем
- опыт работы в FinTech/Enterprise, понимание compliance-требований к данным и аудита изменений
- понимание ML-метрик, A/B тестирования AI-фич, методов валидации и редукции галлюцинаций LLM
- опыт настройки мониторинга, алертинга и cost-оптимизации для AI-сервисов (token usage, latency, fallback-схемы)
- опыт менторства/онбординга джунов, участие в формировании стандартов кодирования в команде.
Мы предлагаем:
- комфортный современный офис на м.Кутузовская
- формат работы офис на время адаптации, далее гибрид
- ежегодный пересмотр зарплаты и годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.