Мы — команда больших данных. Наша главная задача — обеспечивать качество данных для продуктовых команд. Это помогает нам оставаться лидером рынка и своервременно доставлять посылки по всему миру.
Сейчас мы ищем коллегу, который поможет улучшить инфраструктуру для работы с данными. Ты будешь поддерживать и развивать корпоративное хранилище данных в рамках Greenplum и Clickhouse.
Наш стек Airflow, Greenplum, Clickhouse, Kafka, Spark, S3.
Тебе предстоит:
Строить и поддерживать ETL на нашем стеке (airflow, python)
Проектировать модели данных
Писать и оптимизировать SQL-запросы
Написание и оптимизация процессов через pyspark
Написание документации, общение со смежными командами и бизнесом
Мы ожидаем:
Как мы работаем:
Новосибирск
Не указана