Москва, Космодамианская набережная
Метро: МарксистскаяАрхитектура данных: проектирование архитектуры данных на разных логических уровнях и разработка логических и физических моделей данных; проектирование витрин данных для бизнес-аналитики/визуализации и самостоятельного управления данными.
Разработка пайплайнов: разработка и поддержка ETL-пакетов в SSIS для работы с Microsoft SQL Server (загрузка, трансформация и перенос данных); создание и поддержка DAG в Apache Airflow для оркестрации задач обработки данных, выполнение Python ETL-скриптов; оркестрация гибридной инфраструктуры, управление потоками данных между SQL Server, DWH и аналитическими системами.
Коммуникация и взаимодействие: выстраивание взаимодействия с разными группами стейкхолдеров; разработка процессов взаимодействия в Jira/Confluence.
Дата аналитика для бизнеса: разработка дашбордов и отчетов в Apache Superset; создание аналитических витрин для бизнес-пользователей; оптимизация запросов для аналитических систем.
Хранилища и форматы данных: СУБД: PostgreSQL, MySQL/MariaDB; S3-совместимые объектные хранилища (MinIO); OLAP-системы - ClickHouse (обязательно).
Языки программирования: Python (профильно), SQL (продвинутый уровень).
Оркестрация и ETL: Apache Airflow.
Инфраструктура и контроль версий: Git (GitLab).
BI системы: Apache Superset, Metabase.
Машинное обучение (MLOps): знакомство с экосистемой TensorFlow или PyTorch, Spark MLlib для интеграции ML-моделей в пайплайны.
Аналитическое мышление.
Внимание к деталям.
Проактивность и самостоятельность, ответственность и доведение задач до значимого результата
Умение объяснять технические решения нетехническим специалистам
Cotton Club (Коттон Клаб)
Москва
Не указана
АТОЛ, группа компаний
Москва
Не указана