Data Engineer

Москва, Овчинниковская набережная, 18/1с2

Метро: Китай-город

Описание вакансии

ИЩЕМ ТИММЕЙТА В КОМАНДУ УПРАВЛЕНИЯ ДАННЫМИ

Ты будешь отвечать за проектирование и развитие отказоустойчивых пайплайнов потоковой обработки данных, влияя на скорость и качество решений внутренних команд.

С тебя — самостоятельность, инженерная глубина и готовность улучшать существующую платформу, с нас — сложные real-time-задачи, технологичная среда и свобода превращать экспертизу в решения, которыми пользуются аналитики, ML-специалисты и продуктовые команды.

В чем твой вызов?

— Проектировать, разрабатывать и поддерживать высоконагруженные пайплайны для обработки потоковых данных в режиме real time

— Развивать процессы для обработки данных и передачи результатов в целевые системы и внешние API

— Настраивать интеграции в связке Kafka, Flink и ClickHouse, обеспечивая стабильное движение данных между источниками и потребителями

— Очищать, фильтровать, трансформировать и обогащать сырые потоки данных для создания качественных витрин и датасетов.

— Проектировать быстрые витрины с минутными и другими оперативными срезами для аналитических и ML-сценариев

— Оптимизировать существующие потоковые и пакетные процессы, повышая их производительность, надежность и масштабируемость

— Разрабатывать переиспользуемые модули, шаблоны и кастомные расширения, которые помогут быстрее запускать новые процессы обработки данных

— Внедрять механизмы мониторинга, логирования и проверки целостности данных на всех этапах их движения

— Анализировать сбои и узкие места, находить причины проблем и повышать отказоустойчивость real-time-инфраструктуры

— Участвовать в code review и поддерживать единые инженерные стандарты внутри команды.

Три совпадения — и нам точно по пути:

— Ты можешь самостоятельно спроектировать, реализовать и вывести в эксплуатацию решение без постоянного контроля

— Тебе интересны сложные задачи на стыке потоковой обработки, высоких нагрузок и аналитических систем, где результат твоей работы напрямую влияет на скорость принятия решений

— Ты не ограничиваешься поддержкой уже работающих процессов: ищешь возможности для оптимизации, предлагаешь переиспользуемые решения и внимательно относишься к качеству данных и кода.