Москва, Овчинниковская набережная, 18/1с2
Метро: Китай-городТы будешь отвечать за проектирование и развитие отказоустойчивых пайплайнов потоковой обработки данных, влияя на скорость и качество решений внутренних команд.
С тебя — самостоятельность, инженерная глубина и готовность улучшать существующую платформу, с нас — сложные real-time-задачи, технологичная среда и свобода превращать экспертизу в решения, которыми пользуются аналитики, ML-специалисты и продуктовые команды.
— Проектировать, разрабатывать и поддерживать высоконагруженные пайплайны для обработки потоковых данных в режиме real time
— Развивать процессы для обработки данных и передачи результатов в целевые системы и внешние API
— Настраивать интеграции в связке Kafka, Flink и ClickHouse, обеспечивая стабильное движение данных между источниками и потребителями
— Очищать, фильтровать, трансформировать и обогащать сырые потоки данных для создания качественных витрин и датасетов.
— Проектировать быстрые витрины с минутными и другими оперативными срезами для аналитических и ML-сценариев
— Оптимизировать существующие потоковые и пакетные процессы, повышая их производительность, надежность и масштабируемость
— Разрабатывать переиспользуемые модули, шаблоны и кастомные расширения, которые помогут быстрее запускать новые процессы обработки данных
— Внедрять механизмы мониторинга, логирования и проверки целостности данных на всех этапах их движения
— Анализировать сбои и узкие места, находить причины проблем и повышать отказоустойчивость real-time-инфраструктуры
— Участвовать в code review и поддерживать единые инженерные стандарты внутри команды.
— Ты можешь самостоятельно спроектировать, реализовать и вывести в эксплуатацию решение без постоянного контроля
— Тебе интересны сложные задачи на стыке потоковой обработки, высоких нагрузок и аналитических систем, где результат твоей работы напрямую влияет на скорость принятия решений
— Ты не ограничиваешься поддержкой уже работающих процессов: ищешь возможности для оптимизации, предлагаешь переиспользуемые решения и внимательно относишься к качеству данных и кода.
— Есть коммерческий опыт построения и оптимизации высоконагруженных систем потоковой обработки данных
— Уверенно работаешь с Apache Kafka и понимаешь принципы построения решений на базе брокеров сообщений
— Имеешь практический опыт работы с Apache Flink на уровне самостоятельной разработки и оптимизации production-процессов
— Хорошо знаешь ClickHouse и понимаешь, какие движки и архитектурные подходы использовать для обработки real-time-данных
— Уверенно владеешь Python и умеешь писать поддерживаемый production-код
— Работал с Airflow и понимаешь принципы оркестрации процессов. Глубокая экспертиза необязательна, но важно уверенно ориентироваться в инструменте
— Умеешь интегрировать стриминговые решения, брокеры сообщений, API и хранилища данных в единый технологический контур
— Проектировал решения с учетом масштабирования, производительности, стабильности и отказоустойчивости
— Умеешь настраивать мониторинг, логирование, алертинг и проверки качества данных
— Разрабатывал переиспользуемые модули, внутренние библиотеки или шаблоны для ускорения запуска новых пайплайнов
— Участвовал в code review и умеешь аргументированно предлагать улучшения в архитектуре и коде.
→ Рекрутер
→ Техническое интервью
→ Бизнес кейсы (интервью в офисе)
→ СБ и офер
Москва
Не указана