Analytics Engineer (DWH)

СберЗдоровье

Analytics Engineer (DWH)

Описание вакансии

СберЗдоровье - аккредитованная IT-компания, крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины.

Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинских услуг.

Об IT в цифрах:

3 бизнес-направления;

20+ команд (каждая наша команда кросс-функциональная, 7-12 человек, включает в себя QA, DevOps, аналитиков, архитекторов, Web/Mobile разработчиков и конечно же своего PM);

300+ IT специалистов (devops, manual/auto QA, web/mobile devs, backend devs, аналитики и архитекторы) из 40+ городов;

Кого ищем?

Мы в поиске аналитика-разработчика, который будет заниматься преобразованием сырых данных в удобный формат для продуктовых аналитиков в бизнес слое хранилища и позволит аналитикам сосредоточиться на бизнес-выводах, а команде — повысить качество и производительность аналитической инфраструктуры за счёт стандартизации, ускорения расчётов и улучшения документации.

Cтек: SQL - Trino/Hive/Presto; Dbt; Iceberg; CI/CD настройка пайплайнов для dbt, Superset; Python.

Цели и задачи:

  • Выделение мастер-сущностей из ядра ХД, разработка бизнес-правил дедубликации, унификации, создания золотых записей;

  • Разработка витрин на основе объектов raw data vault на движке Trino + Iceberg;

  • Описание моделей данных в DBT с полнотой тестов и документации;

  • Анализ отчётов Superset: определение популярных дашбордов, восстановление lineage от отчета до источника в STG/MDM, помощь в выстраивании витрин;

  • Написание SQL/Python-скриптов для контроля качества данных, инициировать улучшения качества данных;

  • Документирование и обмен знаниями. Ведение каталога данных, участие в код-ревью и внутренних демо;

Зона ответственности:

  • Разработка слоя мастер-данных (MDM) и витрин Data Mart на основе данных в STG (Data Vault 2.0);

  • Разработка переиспользуемых витрин, покрывающих ключевые аналитические отчёты в Superset;

  • Работа в связке с архитектором, аналитиками, продуктовыми командами бизнеса для унификации сущностей (клиенты, заказы, врачи и др.)

Что надо уметь:

  • Уверенный SQL ( написание сложных запросов, понимание того, как работает запрос в БД, как его можно оптимизировать через Explane analyze, как правильно выбрать ключ распределения, минизировать джойны);

  • Python для расчётов;

  • Опыт работы с Data Vault 1.0 / 2.0, понимание основных объектов DV;

  • Опыт построения витрин, применение подходов моделирования измерений и фактов star/snowflake schema;

  • Понимание и использование MDM подходов дедубликации, gold-records, matching, survivorship;

  • Работа с медленно меняющимися данными SCD2, ref;

Что тебе может дать СберЗдоровье:

  • Свободный выбор рабочего формата: удалённый внутри страны или гибридный в Москве;

  • Медицинская программа, включающая телемедицинские консультации, очные приёмы в клиниках, психологов, стоматологию, лабораторные и инструментальные диагностики;
  • Поддерживаем активный образ жизни — выбирай виды спорта по душе (корпоративные занятия сквошем, бегом, футболом в Москве и компенсация твоего спортивного абонемента);
  • Ипотечные программы (IT-ипотека или льготная ипотека для сотрудников Сбера);
  • Индивидуальный план развития каждому, он поможет тебе всегда видеть вектор своего пути;
  • Компенсация профильного обучения и конференций;
  • Ветеринары для ваших домашних животных 24/7

Приятное дополнение:

  • Мы общаемся на “ты”, не любим бюрократию и всегда помогаем друг другу.
  • Devrel и коммьюнити: поможем начать вести блог и делиться своим опытом, выступать на митапах и быть лидером сообщества компетенций;

Навыки
  • Python
  • DBT
  • SQL
  • Superset
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию