Команда занимается разработкой NLP моделей и решений на основе LLM для операционных, интегрированных и ESG рисков. Решаем задачи по построению AI-агентов и мультиагентных систем.
Примеры:
• система гардрейлов для защиты LLM-моделей и AI-агентов Сбера от промпт-атак
• AI-агент для создания и управления базой знаний для сотрудников и других AI-агентов на основе внутренней документации Банка
• разработка и интеграция механизмов безопасности в RAG-системы и чат-боты с контролем alignment-политик методами RLHF/GRPO
• AI-агенты для оценки опер.рисков компаний экосистемы Сбера по внутренним документам, новостям, отчетности и описанию бизнес-процессов
• мультиагентная система по анализу репозиториев кода на уязвимости бизнес-логики и сверка с требованиями на естественном языке
• AI-агент DataEngineer для автономного анализа данных, поиска ошибок и аномалий, создания проверок качества данных, создания выгрузок и витрин.
• разработка PoC и MVP AI-агентов на основе LLM с использованием фреймворков для работы с LLM, таких как langchain/langgraph
• помощь и участие на стадии внедрения AI-агентов (вывод в промышленную эксплуатацию)
• адаптация и обучение LLM Сбера с использованием внутренних и внешних данных (Prompt Tuning, LoRA, SFT, GRPO)
• решение задач NLP (Classification, Summarization (Ext/Abst), Sentence Compression, Simplification, NER, Semantic Search, Clustering)
• писать поддерживаемый, читаемый код; участвовать в ревью, обсуждениях и формировании технических подходов
• курирование стажеров/лидирование Junior DS/кураторство исследовательских работ внутри Сбера и команд из ВУЗов.
• высшее техническое образование с хорошей подготовкой в области математики и алгоритмов
• знание статистики и ML/DL алгоритмов
• знание Python и ML-стэка (PyTorch, TensorFlow, Scikit-learn, Pandas, Scikit-learn)
• опыт проектирования и обучения нейросетевых моделей (от CNN/RNN до трансформеров)
• опыт построения RAG (классический RAG, GraphRAG, Agentic RAG)
• умение разрабатывать автономных AI-агентов на langchain/langgraph
• знание того, какие типы задач эффективнее решать с помощью процессов/потоков. Умение применять модули threading, asyncio, multiprocessing
• знание принципов ООП, паттернов проектирования. Умение писать чистый, поддерживаемый код (clean architecture, SOLID)
• уверенный английский язык для чтения и анализа научных статей и документации.
• опыт написания юнит-тестов на python (pytest)
• опыт работы с БД (PostgreSQL), написания и оптимизации сложных SQL запросов
• опыт в соревнованиях (к примеру Kaggle Expert+, или успехи на других платформах)
• знание других языков программирования (например, C++, Java).
Москва
Не указана