Мы новое подразделение Сбера, занимающееся созданием инструментов и решений для внутренней безопасности с помощью AI. Наши задачи направлены на развитие AI-агентов, создание RAG, запуск локальных инстансов LLM и их файнтюнинг. Наши планы имеют широкий спектр - начиная от разработки DL-моделей для скоринга, поведенческого моделирования и заканчивая графовыми нейронками для выявления скрытых связей.
Ищем Middle Data Scientist в NLP, который будет разрабатывать AI-агентов, адаптировать LLM под специфику задач, строить RAG-системы. Если ты хочешь иметь возможность погрузиться в глубины LLM и Deep Learning, пробовать новые методы к файнтюнингу LLM, строить AI-агентов, то мы ждем тебя в нашу команду.
Обязанности
- Создание и развитие решений с задействованием IA-агентов (полноценные мультиагентские системы).
- Создание Retrieval Augmented Generation (RAG)
- Разработка и поддержка моделей машинного обучения (ML), включая их обновление и адаптация к меняющимся условиям и требованиям бизнеса.
- Дообучение и адаптация открытых LLM: файнтюнинг, Self-Supervised Learning, LoRAСоздание системы мониторинга качества моделей и контроль их эффективности.
- Реализация моделей распознавания объектов и обнаружения артефактов на изображениях.
Требования
- Опыт в ML от 3 лет.
- Опыт создания агентов на LangChain или GigaChain.
- Знание основных концепций промпт-инжиниринга и использования Structured Outputs и Function Calling для моделей.
- Опыт работы с RAG.
- Опыт решения бизнес-задач с использованием различных LLM-моделей (BERT, RoBERT, XLNet, LLaMA) не только через Hugging Face, а файнтюниг с PyTorch
- Запуск LLM локально, понимание чем отличаются LLaMA, Qwen, DeepSeek и пр. будет весомым плюсом.
Что мы оцениваем особо высоко:
- Проактивность и самостоятельность в работе.
- Способность брать ответственность за принятые решения и стремление к постоянному развитию профессиональных навыков.
- Высокая продуктивность и умение быстро осваивать новые направления и подходы.
Желательные компетенции:
- Опыт работы с задачами Anomaly Detection и Named Entity Recognition / Object Extraction.
- Навыки работы с потоковыми системами типа Apache Kafka.
- Владение технологиями видеоаналитики и опыта работы с моделями оценки позы (pose estimation).
- Хорошее представление о структуре изображений и фильтрации визуальных данных.
Используемые технологии:
- Python
- Spring (IoC/DI, beans)
- Hadoop, Spark, Kafka, Elasticsearch
- SOAP, REST
- Bitbucket, Jira, Confluence, Jenkins, OpenShift
Условия
- Офис\гибрид метро Кутузовская
- Полностью белая зарплата плюс ежегодная премия.
- Возможность профессионального роста и корпоративного обучения.
- Корпоративное медицинское страхование и дополнительные льготы сотрудникам.
- Программы поддержки здоровья семьи сотрудника.
- Дополнительные выплаты в экстренных жизненных ситуациях.
- Привилегированные условия кредитования.
- Специальные скидки и акции от партнёров компании (спортивные занятия, страховка, путешествия).