Инженер (Feature Store)

Outlines Technologies

Инженер (Feature Store)

Описание вакансии

Ваша зона ответственности:

  • Реализация высоконагруженных конвейеров обработки данных для обеспечения надежной и бесперебойной репликации данных из ИТ-систем Банка.
  • Реализация комплексных задач по подготовке данных в целевых аналитических хранилищах (DataLake, SandBox, FeatureStore) для построения признаков, необходимых для разработки моделей машинного обучения
  • Разработка и поддержание в актуальном состоянии документации по разработанному функционалу
  • Проверка качества кода (код-ревью), написанного инженерами и младшими инженерами данных
  • Своевременное отражение статуса выполнения задач в Jira.

Необходимые навыки:

  • Python - уверенное знание структур данных и алгоритмов, эффективное применение принципов ООП
  • Опыт написания модульных и интеграционных тестов, знание и опыт применения библиотек обработки и анализа данных - numpy, pandas
  • Опыт разработки и внедрения в промышленную эксплуатацию сервисов загрузки и обработки неструктурированных и слабо структурированных данных (текст, xml, json) из внешних источников
  • Способность разобраться с API поставщиков данных, используя доступную документацию
  • SQL - умение создавать сложные запросы с использованием аналитических оконных функций и использовать инструменты профилирования для оптимизации их производительности, опыт работы с БД Oracle, Postgres, Greenplum
  • Уверенное знание и опыт работы с инструментами разработки, планирования и мониторинга рабочих процессов (workflow engines) пакетной обработки данных - Airflow
  • Опыт разработки сложных, высоконагруженных приложений обработки данных на основе PySpark, уверенное знание настроек Spark и их влияния на производительность приложений Spark.
Навыки
  • PySpark
  • Spark
  • ORACLE
  • PostgreSQL
  • Greenplum
  • Apache Airflow
  • SQL
  • pandas
  • Numpy
  • Python
  • DataLake
  • SandBox
  • FeatureStore
Посмотреть контакты работодателя

Похожие вакансии

Flowwow
Удаленная работа
  • Москва

  • до 350000 RUR

Рекомендуем
Скандинавский центр здоровья

Data Engineer

Скандинавский центр здоровья

Удаленная работа
  • Москва

  • до 350000 RUR

Рекомендуем
MillionAgents
Удаленная работа
  • Москва

  • до 350000 RUR

Рекомендуем
Альфа-Банк

Промпт - инженер

Альфа-Банк

Удаленная работа
  • Москва

  • до 350000 RUR

Selecty
Удаленная работа
  • Москва

  • до 350000 RUR

Staffberry

ML-инженер

Staffberry

Удаленная работа
  • Москва

  • до 350000 RUR

Точка Банк

AI-инженер

Точка Банк

Удаленная работа
  • Москва

  • до 320000 RUR

VK
Удаленная работа
  • Москва

  • до 320000 RUR

Ингосстрах
Удаленная работа
  • Москва

  • до 320000 RUR

МФК Фордевинд

ML-инженер

МФК Фордевинд

Удаленная работа
  • Москва

  • до 320000 RUR

МТС
Удаленная работа
  • Москва

  • до 320000 RUR

АльфаСтрахование

Главный Data Engineer

АльфаСтрахование

Удаленная работа
  • Москва

  • до 320000 RUR

Циан
Удаленная работа
  • Москва

  • до 320000 RUR

evrone.ru
Удаленная работа
  • Москва

  • до 360000 RUR

СБЕР
Удаленная работа
  • Москва

  • до 360000 RUR

Т1
Удаленная работа
  • Москва

  • до 360000 RUR

РСХБ-Интех

Data Engineer NLP

РСХБ-Интех

Удаленная работа
  • Москва

  • до 360000 RUR

Ингосстрах
Удаленная работа
  • Москва

  • до 360000 RUR

RedLab
Удаленная работа
  • Москва

  • до 370000 RUR

Онлайн-школа Тетрика

Lead ML Engineer

Онлайн-школа Тетрика

Удаленная работа
  • Москва

  • до 370000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию