Data Scientist / Python ML программист

Х5 Group

Data Scientist / Python ML программист

Москва, Средняя Калитниковская улица, 28с4

Описание вакансии

В команду SOC (центр мониторинга и реагирования на инциденты) требуется аналитик данных. От Вас не требуется знания информационной безопасности, работа будет в классическом виде для аналитика данных. Однако такие знания сможем дать мы!

Что будет делать сотрудник:

  • Разрабатывать ML-модели для обнаружения аномалий в транзакциях и пользовательской активности на основе нормализованных данных;
  • Проводить классификацию и кластеризацию данных для выявления подозрительных паттернов (например, мошеннические кластеры);
  • Настраивать простые ETL-пайплайны для сбора и трансформации данных;
  • Оркестрировать задачи обработки данных через Airflow, обеспечивая надежность процессов;
  • Визуализировать метрики и результаты анализа в Superset/Tableau/Grafana;
  • Оптимизировать запросы в PostgreSQL, ClickHouse и Elasticsearch. (по возможности избегать дорогостоящих\высоконагруженных запросов);
  • Участвовать в сборе прототипов витрин данных;
  • Документировать разработанные решения;

Примеры задач:

  • Построить модель обнаружения аномальных транзакций;
  • Провести кластеризацию пользователей для выявления групп с подозрительным поведением;
  • Настроить дашборды в Superset для мониторинга аномалий и метрик эффективности моделей;
  • Создать Airflow DAG для переобучения моделей;
  • Оптимизировать сложные SQL-запросы в ClickHouse для ускорения анализа больших объемов данных.

Ожидания от кандидата

Технические навыки:

  • Опыт работы с Python (Pandas, Scikit-learn, PySpark, Numpy) для анализа данных и ML;
  • Уверенное знание SQL (оконные функции, оптимизация) и опыт работы с PostgreSQL и ClickHouse;
  • Навыки настройки Airflow для оркестрации ETL/ML-пайплайнов;
  • Понимание потоковой обработки данных и работы с Elasticsearch\Clickhouse (поиск паттернов в логах);
  • Опыт визуализации данных в Superset/Tableau и Grafana;
  • Знание ClickHouse (оптимизация запросов, материализованные представления).

Предметные знания:

  • Методы обнаружения аномалий (isolation forest, autoencoders) и кластеризации (DBSCAN, HDBSCAN);
  • Базовое понимание архитектуры данных (хранилища, конвейеры, мониторинг).

Soft skills:

  • Аналитическое мышление: умение интерпретировать сложные данные и предлагать решения;
  • Проактивность: инициативность в улучшении процессов и моделей;
  • Командная работа: взаимодействие с Data Engineers и аналитиками.

Будет преимуществом(опциональные навыки):

  • Опыт работы с графовыми данными (выявление связанных сущностей);
  • Знание Docker для контейнеризации задач;
  • Настройка алертинга в Grafana/Kibana на основе данных из ClickHouse/Elasticsearch;
  • Опыт в LLM, RAG, Agents.


Что предлагаем:

  • Удалённо или офис Москва/СПБ (на выбор кандидата);
  • Трудовой договор, график 5/2;
  • Имеется юр.лицо с ИТ аккредитацией;
  • ДМС, скидки от партнёров и бонусы в наших внутренних сервисах;
  • Материальная помощь сотрудникам в трудных жизненных ситуациях;
  • Зарплатный проект с возможностью экономить в отпусках.
Навыки
  • Анализ данных
  • Работа с большим объемом информации
  • Data Analysis
  • Machine Learning
  • Исследовательский анализ данных
  • Алгоритмы и структуры данных
Посмотреть контакты работодателя

Адрес

Похожие вакансии

СДЭК
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
М.Видео-Эльдорадо
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Ozon
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Ростелеком Информационные Технологии

Middle Data Scientist

Ростелеком Информационные Технологии

Удаленная работа
  • Москва

  • Не указана

Домклик

Python Developer MLOps

Домклик

Удаленная работа
  • Москва

  • Не указана

WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

Инжиниринговый холдинг «эВ-групп»

ML разработчик

Инжиниринговый холдинг «эВ-групп»

Удаленная работа
  • Москва

  • до 350000 RUR

Онлайн-школа Тетрика

Data Engineer

Онлайн-школа Тетрика

Удаленная работа
  • Москва

  • до 350000 RUR

Банк ВТБ (ПАО)
Удаленная работа
  • Москва

  • до 350000 RUR

Октопустех

ML-инженер

Октопустех

Удаленная работа
  • Москва

  • до 350000 RUR

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 350000 RUR

Marfatech

Data Scientist

Marfatech

Удаленная работа
  • Москва

  • до 350000 RUR

Домклик
Удаленная работа
  • Москва

  • до 350000 RUR

Backend-разработчик (Python)

Сычков Даниил Олегович

Удаленная работа
  • Москва

  • до 350000 RUR

СИНЕРГИЯ

ML разработчик

СИНЕРГИЯ

Удаленная работа
  • Москва

  • до 350000 RUR

VOXYS
Удаленная работа
  • Москва

  • до 350000 RUR

Ок Софт

Antifraud Data Analyst

Ок Софт

Удаленная работа
  • Москва

  • до 350000 RUR

Товеко
Удаленная работа
  • Москва

  • до 60000 RUR

Юрент

Data Engineer

Юрент

Удаленная работа
  • Москва

  • до 60000 RUR

билайн
Удаленная работа
  • Москва

  • до 60000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию