thevisa.com — продукт о визах и путешествиях. У нас есть сайты, интеграции с партнёрами и CRM, поэтому данных много и они приходят со всех сторон.
Нам нужен Data Engineer, который приручит эти данные и обезвредит «кучу API», Airbyte, ClickHouse и Trino так, чтобы бизнес видел цифры, а не звёздочки в глазах.
- Проектировать и развивать хранилище данных: PostgreSQL (операционные/ODS данные) + ClickHouse (аналитика, витрины, отчёты).
- Настраивать и стабилизировать загрузки из «кучи API» (включая Bitrix24 CRM, партнёрские и продуктовые сервисы): ELT/ETL, инкремент, дедупликации, SLA на пайплайны.
- Приручить Airbyte: довести до продакшн-состояния (стабильность, ретраи, алерты) и/или написать кастомные коннекторы; сравнить с альтернативами и предложить план миграции при необходимости.
- Развернуть и обкатать Trino как единый слой запросов (federated SQL), настроить каталоги, безопасность, ресурсные группы.
- Оптимизировать ClickHouse: партиционирование, первичные/скученные ключи, TTL, материализованные представления, агрегирующие таблицы, компрессия.
- Спроектировать модель данных (слои raw → staging → marts), договориться о схемах именования, версионировании и SLA/SLI по данным.
- Настроить мониторинг и качество данных: алерты, проверки полноты/свежести, DQ‑тесты, техдолг-борд.
- Совместно с аналитиками и продуктом выпускать надёжные витрины/дашборды и отчёты.
- 3+ года опыта в Data Engineering или близких ролях.
- Сильный SQL: сложные запросы, оконные функции, оптимизация планов.
- Опыт продакшн‑эксплуатации ClickHouse: партиционирование, TTL, MV, агрегирующие таблицы, профайлинг запросов.
- Уверенный PostgreSQL: индексы, планировщик, репликация/бэкапы на уровне понимания, CDC как плюс.
- Реальная интеграция с «живыми» API: инкрементальные выгрузки, лимиты/квоты, ретраи, идемпотентность.
- Trino/Presto: базовая админка и тюнинг (или быстрый апскилл под менторством, если остальное закрываете сильно).
- Python для коннекторов/утилит и работы с API.
Будет плюсом
- dbt (моделирование и тесты), Airflow/Prefect/Orchest как оркестратор.
- Уверенное пользование linux, ssh, bash
- Kafka/Debezium/CDC‑подходы, очереди и событийная архитектура.
- Опыт с Bitrix24 API и/или CRM‑системами.
- Опыт выбора и миграции между Airbyte/Meltano/Fivetran/Hevo и т.п.
- Облака (Yandex Cloud/AWS/GCP), Terraform/Ansible, мониторинг (Prometheus/Grafana).
- Формат работы - удаленный
- График: гибкий, синхронизации по договорённости.
- Конкурентная заработная плата
- Крутая команда
Почему это интересно
- Сильно повлияете на архитектуру данных: решения коротким путём, минимум бюрократии.
- Реальные, «не книжные» задачи: нестабильные источники, рост трафика, меняющиеся API.
- Можно и нужно спорить с Airbyte — а если не выйдет, смело выбирать замену.
Отраслевой центр разработки и внедрения информационных систем / ОЦРВ
Москва
до 450000 RUR
Москва
до 400000 RUR