Основной стек технологий, встречающийся на наших проектах:
DWH: PostgreSQL, Clickhouse;
Стек Apache: Superset, AirFlow;
Backend: Python, C#, Node.js
Frontend: Typescript, HTML5, CSS3, React и Redux Toolkit.
Обязанности:
- Организация ETL-процессов: разработка, оптимизация и поддержка процессов извлечения, трансформации и загрузки данных;
- Создание и поддержание спецификаций по хранилищу данных: разработка и обновление документации, обеспечение соответствия стандартам;
- Подготовка рекомендаций для создания инфраструктуры: анализ потребностей, выбор технологий, оптимизация;
- Коммуникация со смежными командами: координация работы, обмен информацией, решение проблем;
- Работа с СУБД: опыт работы с ClickHouse, PostgreSQL, оптимизация запросов;
- Автоматизация с Apache Airflow: разработка и поддержка DAG, мониторинг;
- Написание скриптов на Python 3.X и bash: автоматизация задач, обработка данных;
- Обеспечение качества данных: разработка процедур проверки и очистки данных, мониторинг ошибок.
Требования:
- Опыт работы в области обработки данных не менее 2 лет;
- Английский язык — intermediate и выше;
- Опыт разработки архитектуры источников данных и семантического слоя;
- Навыки проектирования модели данных DWH;
- Опыт работы с хранилищами данных на ClickHouse и PostgreSQL;
- Знание Apache Airflow;
- Желательно знание Python 3.X;
- Опыт работы с Linux и написание bash-скриптов.
Условия:
- Оформление по ТК РФ;
- График работы 5/2 с 9:30 до 18:00;
- Гибридный формат работы;
- Офис в шаговой доступности от метро Третьяковская/Полянка;
- Бенефит-кафе: ДМС, фитнес, обучение, отдых и оздоровление;
- Программа компенсации больничных листов;
- Программа привилегий PrimeZone;
- Возможность участия в сообществах компании;
- Тренинги и обучающие курсы.