Мы строим высоконагруженные production-grade ML-системы для обеспечения банковской безопасности. Наш фокус: антифрод, управление рисками, обнаружение аномалий и оптимизация бизнес-процессов. Внедряем различные решения – от классического ML до state-of-the-art архитектур в DL.
Ищем опытного Fullstack DS c мультидоменной экспертизой, готового взять на себя полный цикл (E2E): от постановки задачи и сбора данных до деплоя в прод и настройки мониторинга.
- Самостоятельный поиск и подготовка данных в витринах, работа со стримингами и ETL
Исследования и валидация:
- Проведение экспериментов с версионированием и валидацией метрик
- Глубокая аналитика метрик
Мультидоменность:
- Разработка и обучение моделей в нескольких доменах. От обучения классификатора транзакций (Classic ML) и LLM-агента для разбора логов до Audio модели для транкрибации речи
E2E разработка:
- Проектирование и деплой маштабируемых ML-пайплайнов: от копания в сырых данных и генерации фичей до деплоя микросервиса, который не «ложится» под нагрузкой
Reporting:
- Построение сложных аналитических схем и визуализация метрик
Ифраструктура и интеграция:
- Совместная работа DevOps/Backend по интеграции моделей в микросервисную архитектуру
Лидерство:
- Участие в найме новых сотрудников
- Менторство джунов
- Взаимодействие с бизнес-заказчиками
Опыт работы DS от 5-и лет (с подтверждённым опытом вывода моделей в прод)
- Хорошие знания математической статистики и теории вероятности
- Понимание алгоритмов и структур данных (CS)
- Мультидоменная экспертиза: практический опыт минимум в 2-х доменах (CV, NLP/LLM, TS, RL, RS, Audio)
- Глубокое понимание PyTorch (кастомные архитектуры)
- Понимание архитектуры трансформеров и графовых алгоритмов
Инженерная база:
- Свободное владение Python (чистый код, знание numpy/pandas/scikit-learn)
- Понимание микросервисной архитектуры и работы с очередями (Kafka)
- Опыт написания асинхронных сервисов взаимодействия с ML-моделями (asyncio/aiohttp)
MLOps-инструментарий:
- Опыт с Airflow (оркестрация), MLflow (трекинг), Docker/K8s (контейнеризация)
- Опыт использования систем контроля версий Git/Bitbucket
Data & Infra:
- Уверенное владение SQL (сложные джойны, оконные функции, оптимизация запросов) и знакомство с Big Data стеком (Spark, Hadoop)
- Умение решить любую несложную инфраструктурную задачу, с которой не работал(а) ранее
Будет плюсом:
- Опыт с LLMs (fine-tuning, RAG, evaluation via RAGAS/DeepEval, vLLM).
- Глубокая экспертиза в узком домене из списка
- Уверенный опыт с LangChain, LangGraph, function calling
- Законченный ШАД/ OZON Masters/ AI Masters
Центральный банк Российской Федерации (Банк России)
Москва
Не указана
Центральный банк Российской Федерации (Банк России)
Москва
Не указана