СберЗдоровье - аккредитованная IT-компания, крупнейшая в России Digital Health платформа, объединяющая различные сервисы цифровой медицины.
Сервис начал свою работу в 2012 году под брендом DocDoc. Мы помогли миллионам людей получить помощь и продолжаем повышать качество медицинских услуг.
Об IT в цифрах:
3 бизнес-направления;
20+ команд (каждая наша команда кросс-функциональная, 7-12 человек, включает в себя QA, DevOps, аналитиков, архитекторов, Web/Mobile разработчиков и конечно же своего PM);
300+ IT специалистов (devops, manual/auto QA, web/mobile devs, backend devs, аналитики и архитекторы) из 40+ городов;
Кого ищем?
Мы в поиске аналитика-разработчика, который будет заниматься преобразованием сырых данных в удобный формат для продуктовых аналитиков в бизнес слое хранилища и позволит аналитикам сосредоточиться на бизнес-выводах, а команде — повысить качество и производительность аналитической инфраструктуры за счёт стандартизации, ускорения расчётов и улучшения документации.
Цели и задачи:
Выделение мастер-сущностей из ядра ХД, разработка бизнес-правил дедубликации, унификации, создания золотых записей;
Разработка витрин на основе объектов raw data vault на движке Trino + Iceberg;
Описание моделей данных в DBT с полнотой тестов и документации;
Анализ отчётов Superset: определение популярных дашбордов, восстановление lineage от отчета до источника в STG/MDM, помощь в выстраивании витрин;
Написание SQL/Python-скриптов для контроля качества данных, инициировать улучшения качества данных;
Документирование и обмен знаниями. Ведение каталога данных, участие в код-ревью и внутренних демо;
Зона ответственности:
Разработка слоя мастер-данных (MDM) и витрин Data Mart на основе данных в STG (Data Vault 2.0);
Разработка переиспользуемых витрин, покрывающих ключевые аналитические отчёты в Superset;
Работа в связке с архитектором, аналитиками, продуктовыми командами бизнеса для унификации сущностей (клиенты, заказы, врачи и др.)
Что надо уметь:
Уверенный SQL ( написание сложных запросов, понимание того, как работает запрос в БД, как его можно оптимизировать через Explane analyze, как правильно выбрать ключ распределения, минизировать джойны);
Python для расчётов;
Опыт работы с Data Vault 1.0 / 2.0, понимание основных объектов DV;
Опыт построения витрин, применение подходов моделирования измерений и фактов star/snowflake schema;
Понимание и использование MDM подходов дедубликации, gold-records, matching, survivorship;
Что тебе может дать СберЗдоровье:
Свободный выбор рабочего формата: удалённый внутри страны или гибридный в Москве;
Приятное дополнение: