Основной стек технологий, встречающийся на наших проектах:
DWH: PostgreSQL, Clickhouse;
Стек Apache: Superset, AirFlow;
Backend: Python, C#, Node.js
Frontend: Typescript, HTML5, CSS3, React и Redux Toolkit
Чем предстоит заниматься:
- Организация ETL-процессов: разработка, оптимизация и поддержка процессов извлечения, трансформации и загрузки данных
- Создание и поддержание спецификаций по хранилищу данных: разработка и обновление документации, обеспечение соответствия стандартам
- Подготовка рекомендаций для создания инфраструктуры: анализ потребностей, выбор технологий, оптимизация
- Коммуникация со смежными командами: координация работы, обмен информацией, решение проблем
- Работа с СУБД: опыт работы с ClickHouse, PostgreSQL, оптимизация запросов
- Автоматизация с Apache Airflow: разработка и поддержка DAG, мониторинг
- Написание скриптов на Python 3.X и bash: автоматизация задач, обработка данных
- Обеспечение качества данных: разработка процедур проверки и очистки данных, мониторинг ошибок
Наши ожидания от кандидата:
- Опыт работы в области обработки данных не менее 2 лет
- Английский язык — intermediate и выше
- Опыт разработки архитектуры источников данных и семантического слоя
- Навыки проектирования модели данных DWH
- Опыт работы с хранилищами данных на ClickHouse и PostgreSQL
- Знание Apache Airflow
- Желательно знание Python 3.X
- Опыт работы с Linux и написание bash-скриптов
Мы предлагаем:
- Оформление по ТК РФ;
- График работы 5/2 с 9:30 до 18:00;
- Гибридный формат работы;
- Офис в шаговой доступности от метро Третьяковская/Полянка;
- Бенефит-кафе: ДМС, фитнес, обучение, отдых и оздоровление;
- Программа компенсации больничных листов;
- Программа привилегий PrimeZone;
- Возможность участия в сообществах компании;
- Тренинги и обучающие курсы.