ML Researcher (Fintech / DL)

Москва, Большая Татарская улица, 11

Метро: Новокузнецкая

Описание вакансии

О команде:

В Центре машинного обучения и анализа данных мы разрабатываем, сопровождаем и развиваем ML-системы, помогая продуктовым и бизнес-командам принимать решения на основе данных. Занимаемся полным циклом: от исследования и прототипирования решений (классический ML и нейросети) до внедрения моделей в продакшен, мониторинга и обеспечения стабильной работы сервисов.

Обязанности:

Проводить исследования полного цикла: проверка гипотез, дизайн экспериментов, тестирование SOTA-подходов, глубокий анализ результатов
Разрабатывать ML/DL-решения для табличных, последовательных и транзакционных данных в области финтеха
Исследовать архитектуры трансформеров для многомерных временных рядов и обучать нейросетевые эмбеддинги для представления клиентов и транзакций
Разрабатывать графовые модели и эмбеддинги для анализа связей, выявления паттернов поведения и аномалий
Автоматизировать исследовательскую рутину, превращая эксперименты в воспроизводимые пайплайны и удобные инструменты
Формировать и приоритизировать исследовательский backlog, определяя вектор развития направления
Упаковывать и презентовать результаты исследований бизнесу и техническим командам
Взаимодействовать с бизнес-заказчиками и смежными командами: сбор, оценка и формулировка в ML-терминах технических и бизнес-требований к разрабатываемым моделям
Делиться экспертизой с коллегами, помогать формировать культуру ML-исследований в команде
Участвовать в жизни внутреннего Data Community: публикация технических статей, выступления на внутренних и внешних митапах в качестве спикера

Требования:

Опыт работы Data Scientist / DL Engineer / ML Researcher от 2 до 3 лет
Сильная математическая база: линейная алгебра, теория вероятностей, математическая статистика, методы оптимизации
Глубокое понимание классического ML и DL: алгоритмы, архитектуры, основы и принципы обучения больших языковых моделей (LLM)
Знание современных DL-подходов: Transformer-архитектуры, Representation learning, Self-Supervised learning, Contrastive learning и Metric learning
Уверенное владение Python (ООП, чистый код) и умение писать воспроизводимые исследовательские скрипты и ноутбуки
Уверенное владение SQL и опыт работы с большими объёмами данных
(ClickHouse, Hadoop)
Практический опыт работы с основным ML стеком: Pandas/Polars, Numpy, Matplotlib, Seaborn, Sklearn, XGBoost/LightGBM/CatBoost
Уверенное владение фреймворками глубокого обучения (PyTorch / TensorFlow / JAX) для релевантных задач (например, последовательности событий, текст, табличные данные, графы)
Опыт самостоятельного ведения исследований: дизайн экспериментов, проверка гипотез, анализ SOTA-статей и адаптация идей под задачу
Английский язык на уровне чтения технической документации и научных статей
Базовые навыки работы с Git для версионирования кода

Условия:

Оформление согласно ТК РФ
Достойный уровень заработной платы + премии
График работы: 5/2 с 9:15 до 18:00 (гибрид)
Дополнительный социальный пакет: телемедицина, полис для выезжающих за рубеж, страхование от несчастных случаев и рисковых заболеваний, доплата по больничным листам до 20 дней в году, частичная компенсация затрат на покупку путевок в летний детский лагерь
Комфортный офис в центре: тренажерный и спортивный залы, лаунж-зона, микромаркеты, кухни с чаем, кофе и снеками на каждом этаже