Senior Data Engineer (Azure Databricks)

Senior Data Engineer (Azure Databricks)

Описание вакансии

Ищем опытного сотрудника на позицию Senior Data Engineer для работы в DWH команде заказчика (международная фармацевтическая компания). Основной задачей будет разработка и развитие Data Lakehouse на базе Azure Databricks, включая перенос данных из существующих систем (в первую очередь MS SQL Server), построение надежных ingestion-процессов и подготовку данных для аналитики и BI. От кандидата ожидаем готовности к работе с международной data-командой, понимания архитектуры решений и знания лучших практик работы с данным в рамках используемого стека, опыта выполнения аналогичных проектов.

Технологический стек:

  • Azure Databricks (Apache Spark, PySpark, Spark SQL, Delta Lake)
  • MS SQL Server
  • Python, SQL
  • Power BI
  • Informatica CDGC (Cloud Data Governance & Catalog)

Обязанности:

  • Разработка и поддержка data pipelines для загрузки данных в Data Lake на базе Databricks
  • Перенос и интеграция данных из MS SQL Server в архитектуру Data Lakehouse
  • Проектирование и реализация ingestion pipelines для загрузки данных из различных источников: баз данных, API, файлов (CSV, Excel, JSON), FTP/SFTP
  • Разработка процессов загрузки данных в raw (bronze) слой Data Lake с учетом требований к надежности и воспроизводимости
  • Реализация трансформации данных и формирование silver и gold слоев для аналитики и BI
  • Оптимизация обработки данных и производительности Spark / SQL-запросов
  • Разрабатка и внедрение best practices работы с данными в Data Lake (структура данных, стандарты ingestion, контроль качества данных)
  • Обеспечение мониторинга, логгирования и обработки ошибок в data pipelines
  • Работа с метаданными, каталогом данных и data lineage (Informatica’s CDGC)

Обязательные требования:
  • Опыт работы Data Engineer от 5 лет
  • Отличное знание SQL и опыт работы с MS SQL Server или другими реляционными базами данных
  • Уверенное владение Python и опыт использования систем контроля версий (Git)
  • Опыт разработки ETL/ELT pipelines, включая инкрементальные загрузки и обработку ошибок
  • Опыт работы с форматами данных Parquet, CSV, JSON и интеграции данных из различных источников (базы данных, API, файлы, FTP)
  • Практический опыт работы с Apache Spark (PySpark или Spark SQL)
  • Опыт работы с Databricks и Delta Lake
  • Опыт работы с Azure или другими облачными платформами
  • Понимание принципов построения Data Lake / Lakehouse архитектуры
  • Опыт подготовки данных для BI-систем (Power BI, Qlik Sense и др.)
  • Уверенное знание английского языка (предполагается частая коммуникация с коллегами из международной data-команды)

Плюсом будет:

  • Опыт работы на профильной позиции в международной фармацевтической / FMCG компании
  • Опыт работы с data catalog / data governance инструментами

Условия:
  • Удаленная работа
  • График работы: 5/2 с 09:00 до 18:00 или с 10:00 до 19:00
  • Трудоустройство по ТК РФ
  • Аккредитованная IT-компания
Посмотреть контакты работодателя

Похожие вакансии

Юматекс
  • Москва

  • Не указана

Рекомендуем
Dream Job
  • Москва

  • до 450000 RUR

Рекомендуем
МТС
  • Москва

  • до 450000 RUR

Рекомендуем
MAREE
  • Москва

  • до 450000 RUR

Senior AI Engineer (Telegram Mini Apps)

Гулов Олег Николаевич

  • Москва

  • до 550000 RUR

Точка Банк

Инженер данных

Точка Банк

  • Москва

  • до 550000 RUR

  • Москва

  • до 7000 USD

Softline
  • Москва

  • до 7000 USD

Ит-Финанс

Data Analyst

Ит-Финанс

  • Москва

  • до 7000 USD

WMT
  • Москва

  • до 7000 USD

  • Москва

  • до 7000 USD

Вишня
  • Москва

  • до 500000 RUR

SkillStaff
  • Москва

  • до 400000 RUR

Marfatech

Team Lead SRE

Marfatech

  • Москва

  • до 400000 RUR

Trading Integral Solutions

Senior Data Scientist – Energy Trading

Trading Integral Solutions

  • Москва

  • до 7000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию