Чем мы занимаемся:
Мы строим агентные решения на базе LLM для высоконагруженных сервисов оценки нефинансовых рисков.
Ищем опытного Python-инженера, который любит ML, понимает его ограничений и силу, и хочет делать «настоящий» продакшен-бэкенд: надёжный, масштабируемый, с чёткой инженерной культурой.
Вам предстоит внедрять современные подходы ML System Design, проектировать и эволюционировать агентные системы, которые реально приносят бизнес-ценность.
Если вам близок дух Bell Labs/Xerox PARC в их лучшие годы — исследовать, проверять гипотезы и доводить до прома — вам к нам.
Обязанности
Чем вы будете заниматься:п
- Проектировать и разрабатывать backend-сервисы на Python для LLM-агентов и ML-пайплайнов (низкие задержки, высокая надёжность, observability).
- встраивать и развивать архитектуру агентных систем (оркестрация инструментов, память, планирование, безопасные guardrails, оценка качества).
- внедрять ML System Design подходы: искать и применять передовые идеи и мировой опыт в области архитектур агентных систем.
- Работать с данными и интеграциями: очереди/стриминг, базы, кэш, внешние API. У нас есть все.
- проводить технические исследования (R&D), быстро прототипировать, измерять, масштабировать в прод.
- развивать платформу: тестирование, CI/CD, мониторинг, трассировка, расходы.
- Влиять на инженерную культуру: код-ревью, дизайн-сессии, менторство.
Технологический ландшафт (примерно)
Python 3.11+, FastAPI, Dishka, gRPC/HTTP, Kafka, PostgreSQL/PgVector; Triton/vLLM/SgLang/ONNX, PyTorch/Lightning, инструменты для LLM-оркестрации, LangGraph, CrewAI, mem0, NeMo Guardrails.
Требования
Подходит вам, если у вас есть
- 4–8+ лет промышленной backend-разработки на Python (или близком стеке) с акцентом на надёжность и производительность.
- опыт проектирования распределённых систем и высоконагруженных сервисов.
- уверенная математическая база (вероятность/статистика/оптимизация), инженерный вкус и привычка мерить всё метриками.
- практика работы с ML-системами в проде: фичи, офлайн/онлайн-оценка, A/B, наблюдаемость качества.
- навык разбираться в новых подходах (LLM-агенты, инструменты, память, RAG, оценка), критически их проверять и доводить до результата.
- готовность брать ответственность за продуктовые эффекты, а не только за код.
Будет плюсом
- опыт построения agentic-архитектур (планировщики, многoшаговые цепочки, инструментализация, безопасность).
- опыт реализации высокоэффективного инференса LLM моделей, глубокое понимание работы kernelов для инференса.
- вклад в open-source или публикации/доклады.
Условия
Почему с нами интересно
- реальные масштаб и влияние: мы создаем новую парадигму управления нефинансовыми рисками, автономно, без людей, мгновенно и надежно.
- свобода экспериментов с ответственностью: быстрые прототипы → измерения → продуктив — без бесконечных «вечных» исследований.
- минимум лишней бюрократии: мы знаем её слабые места и выстраиваем процессы так, чтобы вы этого почти не чувствовали (фаст-трек согласований, понятные правила деплоя и доступа).
- сильная команда: дизайн-сессии, ревью, обмен знаниями; можно расти в Staff/Tech Lead или углубляться в системный/ML-дизайн
- комфортный офис по адресу Кутузовский проспект, 32
- формат работы - гибрид
- уникальная система обучения Сбера для профессионального и карьерного развития, семинары, тренинги, конференции
- программа адаптации и помощь руководителя на старте
- ДМС, страхование от несчастных случаев, социальные гарантии
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера
- корпоративная пенсионная программа
- корпоративные мероприятия.