О команде:
В Центре машинного обучения и анализа данных мы разрабатываем, сопровождаем и развиваем ML-системы, помогая продуктовым и бизнес-командам принимать решения на основе данных. Занимаемся полным циклом: от исследования и прототипирования решений (классический ML и нейросети) до внедрения моделей в продакшен, мониторинга и обеспечения стабильной работы сервисов.
Обязанности: - Проводить исследования полного цикла: проверка гипотез, дизайн экспериментов, тестирование SOTA-подходов, глубокий анализ результатов
- Разрабатывать ML/DL-решения для табличных, последовательных и транзакционных данных в области финтеха
- Исследовать архитектуры трансформеров для многомерных временных рядов и обучать нейросетевые эмбеддинги для представления клиентов и транзакций
- Разрабатывать графовые модели и эмбеддинги для анализа связей, выявления паттернов поведения и аномалий
- Автоматизировать исследовательскую рутину, превращая эксперименты в воспроизводимые пайплайны и удобные инструменты
- Формировать и приоритизировать исследовательский backlog, определяя вектор развития направления
- Упаковывать и презентовать результаты исследований бизнесу и техническим командам
- Взаимодействовать с бизнес-заказчиками и смежными командами: сбор, оценка и формулировка в ML-терминах технических и бизнес-требований к разрабатываемым моделям
- Делиться экспертизой с коллегами, помогать формировать культуру ML-исследований в команде
- Участвовать в жизни внутреннего Data Community: публикация технических статей, выступления на внутренних и внешних митапах в качестве спикера
Требования: - Опыт работы Data Scientist / DL Engineer / ML Researcher от 2 до 3 лет
- Сильная математическая база: линейная алгебра, теория вероятностей, математическая статистика, методы оптимизации
- Глубокое понимание классического ML и DL: алгоритмы, архитектуры, основы и принципы обучения больших языковых моделей (LLM)
- Знание современных DL-подходов: Transformer-архитектуры, Representation learning, Self-Supervised learning, Contrastive learning и Metric learning
- Уверенное владение Python (ООП, чистый код) и умение писать воспроизводимые исследовательские скрипты и ноутбуки
- Уверенное владение SQL и опыт работы с большими объёмами данных
(ClickHouse, Hadoop) - Практический опыт работы с основным ML стеком: Pandas/Polars, Numpy, Matplotlib, Seaborn, Sklearn, XGBoost/LightGBM/CatBoost
- Уверенное владение фреймворками глубокого обучения (PyTorch / TensorFlow / JAX) для релевантных задач (например, последовательности событий, текст, табличные данные, графы)
- Опыт самостоятельного ведения исследований: дизайн экспериментов, проверка гипотез, анализ SOTA-статей и адаптация идей под задачу
- Английский язык на уровне чтения технической документации и научных статей
- Базовые навыки работы с Git для версионирования кода
Условия: - Оформление согласно ТК РФ
- Достойный уровень заработной платы + премии
- График работы: 5/2 с 9:15 до 18:00 (гибрид)
- Дополнительный социальный пакет: телемедицина, полис для выезжающих за рубеж, страхование от несчастных случаев и рисковых заболеваний, доплата по больничным листам до 20 дней в году, частичная компенсация затрат на покупку путевок в летний детский лагерь
- Комфортный офис в центре: тренажерный и спортивный залы, лаунж-зона, микромаркеты, кухни с чаем, кофе и снеками на каждом этаже