Москва, Калужско-Рижская линия, метро Третьяковская
Метро: Полянка
Вам предстоит:
Проектировать и развивать слои DWH/DLH, включая разработку концептуальной, логической и физической моделей данных и их адаптацию под платформы (GP, Iceberg, CH) с целью оптимизации и сокращения TTM
Разрабатывать, внедрять и контролировать соблюдения стандартов моделирования, разработки и анализа данных, а также участвовать в формировании единых практик и политик управления данными (Data Governance)
Проектировать и развивать пайплайны доставки данных (источники→ витрины)
Определять и внедрять контроль качества данных (DQ) на всех слоях (raw, ods, core, dm), формализация и стандартизация проверок
Организовывать и развивать способы работы с метаданными (техническими, бизнес, операционными), включая их сбор, хранение и интеграцию с бизнес-глоссарием
Развивать платформу данных и автоматизацию
Проектировать и внедрять ролевые модели доступа, участвовать в автоматизации управления доступами и проработке подходов к работе с чувствительными данными
Работать с пользователями (согласовывать требования, согласовывать решения, презентовать решения, защищать решения)
Будет плюсом:
Опыт работы с dbt
Опыт работы с Apache Iceberg, ClickHouse
Опыт проработки хранения и обработки чувствительных данных
Опыт проектирования семантической модели данных
Понимание DataOps и практик непрерывной доставки изменений в DWH
SQL (эксперт)
Greenplum, Teradata, Vertica (экспертное знание физической модели, распределения, партиций, оптимизации запросов)
S3, Kafka, Airflow, Git (опыт работы)
Python, Java, C# (базовые знания одного из языков)