Наша команда (70+ человек) создает технологический фундамент для внедрения GenAI в экосистему банка. Мы разрабатываем RAG-платформу, фреймворк исполнения агентов и системы обработки неструктурированного контента (документы, коммуникации). Наши сервисы оборачивают базовые LLM в готовые интерфейсы, позволяя бизнесу быстро создавать собственных агентов и GenAI-приложения.
Мы обеспечиваем полный цикл разработки (E2E): ML-инженеры и бэкенд-разработчики работают вместе над реализацией сервисов, в связке с фронтендом и дизайнерами. У нас есть собственная команда разметки для оценки качества и сбора датасетов, с помощью которых мы дообучаем доменные модели под банковские сценарии.
Масштаб задач:
Сейчас в портфеле более 200 реализованных сценариев.
В планах — реализация еще 300+ сценариев, включая создание слоя процедурной памяти для агентов, специализированных поисковых агентов и систем автоматической оценки качества GenAI (Auto-Eval).
Развитие Self-Service инструментов (песочниц с UI), где команды банка могут тестировать гипотезы перед интеграцией.
Чем предстоит заниматься
Мы ищем инженеров, которым интересно не только R&D, но и создание полноценных продуктовых систем, способных обучаться на пользовательском фидбэке и решать конкретные бизнес-задачи.
Обязанности
- Развитие GenAI сервисов: Создание и улучшение RAG-систем (в т.ч. Agentic RAG), инструментов Agent Observability, сервисов обработки документов
- обучение моделей: тренировка и дообучение мультимодальных моделей на русском языке (OCR, Embeddings, Rerankers, VLM)
- MLOps и Data Management: Организация и автоматизация процесса разметки данных (от сбора до контроля качества краудсорсинга)
- развитие автономных пайплайнов улучшения качества моделей с использованием LLM-as-a-Judge
- Engineering: релиз новых моделей и сервисов в продуктовые среды.
Требования
- Глубокое понимание LLM: опыт работы с большими языковыми моделями, Prompt Engineering, Fine-tuning LLM/VLM
- инженерная культура: уверенное владение Python 3, знание ООП, принципов SOLID. Хорошее знание алгоритмов и структур данных.
- LLM Stack: опыт работы с LangChain, LlamaIndex или другими фреймворками для разработки агентов и мультиагентных систем (MAS)
- Vibe Coding: умение автоматизировать собственные рутинные процессы с помощью AI-инструментов
- Mindset: желание постоянно изучать новые SOTA-подходы, модели и технологии.
БУДЕТ ПЛЮСОМ:
- Активный профиль на GitHub с качественным кодом
- достижения (медали) на Kaggle
- участие в Open-Source проектах, связанных с LLM/NLP.
Условия
- комфортный современный офис рядом с м. Кутузовская
- гибридный формат работы
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- ипотека для сотрудников выгоднее до 4%
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбера.