Data Engineer

Описание вакансии

Мы — многопрофильный холдинг ИТР, один из наших проектов — аналитическая платформа рыночных данных на базе ИИ для стратегического планирования и оптимизации расходов, времени и ресурсов. Сейчас мы в поиске Data Engineer в нашу команду.

Твои задачи:
— Создание и поддержка DAG в Apache Airflow для автоматической обработки входящих файлов (PDF, XLSX, CSV) в количестве 55 000+ единиц.
— Парсинг сложных документов, написание скриптов на Python для обработки Excel-файлов с мультилистами, объединенными ячейками и нестандартными сдвигами по годам.
— Очистка данных, приведение временных срезов к единому формату, извлечение и обогащение метаданных для последующего анализа.
— Организация загрузки данных в PostgreSQL с использованием модели schema-per-tenant. Автоматизация создания и клонирования шаблонов схем при подключении (onboarding) нового клиента.
— Обеспечение взаимодействия пайплайнов с enterprise-хранилищами (MinIO / S3) для чтения исходных файлов и сохранения результатов обработки.

Что важно для нас:
— Уверенное владение Python и библиотеками для работы с данными (Pandas, OpenPyXL, PyPDF2 и аналоги).
— Понимание архитектуры Airflow, умение проектировать DAG, настраивать сенсоры (file sensors) и работать с очередями задач.
— Опыт управления схемами (schema-per-tenant), понимание процессов резервного копирования и восстановления (pg_dump/pg_restore) на уровне схем.
— Готовность разбираться в нестандартных структурах таблиц, умение писать устойчивый к ошибкам код для парсинга сложных Excel-отчетов.
— Опыт с Docker / Docker Compose для развертывания и локального тестирования сервисов.

Условия и возможности:
— График 5/2, гибридный формат работы (возможна полная удаленка).
— Работа с передовыми технологиями: Реальные задачи ИИ и аналитики, работа с большим объемом данных и современным стеком.
— Конкурентная заработная плата, обсуждаемая по итогам собеседования с учетом ваших компетенций.

Посмотреть контакты работодателя

Похожие вакансии

Онлайн-школа Тетрика

Data Engineer

Онлайн-школа Тетрика

  • Москва

  • Не указана

Рекомендуем

Data Engineer

Кидс Аппс

  • Москва

  • Не указана

Рекомендуем
А101
  • Москва

  • Не указана

Рекомендуем
Amex Development

Инженер ETL

Amex Development

  • Москва

  • от 250000 RUR

АйТиКвик
  • Москва

  • до 450000 RUR

Интерфакс

ML - инженер (СКАН)

Интерфакс

  • Москва

  • до 450000 RUR

YADRO
  • Москва

  • до 450000 RUR

ОТР
  • Москва

  • до 450000 RUR

Amex Development

ML-инженер

Amex Development

  • Москва

  • от 230000 RUR

Программный Продукт, ИТ-компания

ML инженер

Программный Продукт, ИТ-компания

  • Москва

  • от 230000 RUR

Riverstart (ООО Риверстарт)

Data engineer / Инженер данных (Middle+)

Riverstart (ООО Риверстарт)

  • Москва

  • до 240000 RUR

ИЦ АЙ-ТЕКО

ML инженер

ИЦ АЙ-ТЕКО

  • Москва

  • до 240000 RUR

РТК-ЦОД

Data Engineer

РТК-ЦОД

  • Москва

  • до 240000 RUR

Группа компаний Эталон

Data Scientist

Группа компаний Эталон

  • Москва

  • до 240000 RUR

START
  • Москва

  • до 240000 RUR

Арнест ЮниРусь
  • Москва

  • до 240000 RUR

PLC.01

Data Engineer

PLC.01

  • Москва

  • до 240000 RUR

Аренадата Софтвер

Python / AI Developer (GenAI & Data Systems)

Аренадата Софтвер

  • Москва

  • до 240000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию