Team Lead команды Data Quality
Мы ищем технического лидера, который возглавит команду Data Quality и выстроит процессы обеспечения качества данных в масштабах всей дата-платформы. Вы будете отвечать как за развитие людей, так и за технологическую стратегию: фреймворки контроля качества, метрики, инциденты, SLA по данным.
Чем предстоит заниматься
- Руководить командой DQ-инженеров (найм, развитие, 1:1, performance review, планирование загрузки)
- Развивать единый фреймворк проверок качества данных (freshness, completeness, accuracy, uniqueness, consistency, lineage)
- Внедрять и развивать инструменты DQ-стека: Great Expectations / Soda / dbt tests / собственные решения на Spark/Airflow
- Определять и поддерживать SLA / SLI / SLO по ключевым датасетам, выстраивать процесс работы с инцидентами и Data Incident Management
- Внедрять подходы Data Observability и Data Contracts между продьюсерами и консьюмерами данных
- Взаимодействовать со стейкхолдерами: дата-инженерами, аналитиками, ML-командами, бизнес-заказчиками, Data Governance
- Формировать roadmap команды, защищать его перед руководством, приоритизировать задачи
- Участвовать в архитектурных решениях по платформе данных с точки зрения качества и наблюдаемости
- Развивать культуру качества данных в компании: документация, обучение, ownership датасетов
Что важно для нас
- Опыт работы с данными от 5 лет, из них от 1–2 лет в роли тимлида / техлида команды от 3 человек
- Уверенные знания SQL и Python, понимание принципов построения ETL/ELT-пайплайнов
- Практический опыт с современным стеком: Airflow, Spark, dbt, Kafka, объектные хранилища (S3), Data Warehouse (Snowflake / BigQuery / ClickHouse / Greenplum)
- Опыт внедрения DQ-инструментов (Great Expectations, Soda, Monte Carlo, dbt tests или аналогичных) в production
- Понимание методологий моделирования данных (Kimball, Data Vault, Anchor) и Data Contracts
- Опыт работы с метриками качества, построения дашбордов и алертинга
- Навыки управления: декомпозиция задач, планирование, ревью, развитие сотрудников, найм
- Умение коммуницировать с разными уровнями стейкхолдеров и аргументированно отстаивать технические решения
Будет плюсом
- Опыт построения Data Catalog / Data Lineage решений (DataHub, Amundsen, OpenMetadata, Collibra)
- Знакомство с практиками Data Mesh и Data Governance
- Опыт работы в финтехе / e-commerce / телекоме (или другой регулируемой/высоконагруженной области)
- Опыт миграций между хранилищами и работа с большими объёмами данных (десятки ТБ+)
- Понимание ML-пайплайнов и специфики качества фич для моделей
Что мы предлагаем
- Прямое влияние на качество данных, которыми пользуется вся компания
- Современный технологический стек и возможность его развивать
- Зрелую инженерную культуру: код-ревью, документация, инцидент-менеджмент
- Бюджет на обучение, конференции, литературу
- Гибкий формат работы (удалённо / гибрид / офис — уточнить)
- Конкурентную зарплату и систему бонусов