Data Engineer

Описание вакансии

Каждый день наши автономные машины собирают терабайты данных, которые мы собираем и анализируем для улучшения и тестирования нашего ПО. Мы ищем человека, который поможет нам в этой задаче и будет заниматься разработкой пайплайнов обработки данных и добавлять в них новый функционал.

Вакансия подразумевает работу с большими объемами технических данных с использованием SQL, Dagster, Spark и polars/pandas где объемы данных позволяют.

Чем предстоит заниматься:

  • Реализовать пайплайн/шаг в существующем пайплайне в котором будет реализован алгоритм расчета метрики функции автономного вождения (качество удержания в полосе, качество локализации, дальность распознавания);
  • Оптимизировать обработку данных в существующем алгоритме путем перехода со Spark на Polars/Pyarrow с распараллеливанием обработки или оптимизации Spark запросов.
  • Разрабатывать пайплайны обработки данных
  • Формировать витрины с метриками
  • Регламентация алгоритмов расчета метрик функций беспилотного вождения.

Наш стек: Python (pandas, polars, pyspark), Spark, Dagster, Kubernetes, S3, Clickhouse, Metabase

Что мы ждем от кандидатов:

  • Разработка на языке Python;
  • Хорошее знание SQL (на уровне джойнов и оконных функций);
  • Был опыт обработки данных с использованием Python (Pandas/Polars);
  • Знакомство со Spark и Airflow.

Будет плюсом:

  • Опыт работы с Clickhouse;
  • Опыт работы с Airflow/Luidgi/Dagster.
Посмотреть контакты работодателя

Похожие вакансии

ВОДОВОЗ.RU

Data Scientist

ВОДОВОЗ.RU

Полный день
  • Москва

  • Не указана

Рекомендуем
АНО ЦИСМ

Data Engineer

АНО ЦИСМ

Полный день
  • Москва

  • Не указана

Рекомендуем
ИЦ АЙ-ТЕКО

Data Engineer

ИЦ АЙ-ТЕКО

Полный день
  • Москва

  • Не указана

Рекомендуем
РСХБ-Интех
Удаленная работа
  • Москва

  • Не указана

VK
Полный день
  • Москва

  • Не указана

ГУП Московский социальный регистр

Data Scientist

ГУП Московский социальный регистр

Полный день
  • Москва

  • Не указана

Национальная Лотерея

Data Engineer

Национальная Лотерея

Удаленная работа
  • Москва

  • Не указана

БФТ-Холдинг

Data Scientist (NLP, RAG)

БФТ-Холдинг

Удаленная работа
  • Москва

  • Не указана

Aston
Удаленная работа
  • Москва

  • Не указана

STARTRIBE LTD
Полный день
  • Москва

  • Не указана

Botan Investments

ML Engineer (RecSys)

Botan Investments

Полный день
  • Москва

  • Не указана

Программный Продукт, ИТ-компания

Data Engineer

Программный Продукт, ИТ-компания

Удаленная работа
  • Москва

  • Не указана

Бристоль, сеть магазинов

Data Scientist/Аналитик данных (Москва_гибрид)

Бристоль, сеть магазинов

Полный день
  • Москва

  • до 276000 RUR

ОВЕН, Производственное объединение

Data Engineer

ОВЕН, Производственное объединение

Полный день
  • Москва

  • до 276000 RUR

Меридиан

ML/Big Data Engineer

Меридиан

Удаленная работа
  • Москва

  • до 276000 RUR

Servicepipe

Data Analyst

Servicepipe

Полный день
  • Москва

  • до 276000 RUR

Оператор информационной системы

Инженер данных (Data Engineer)

Оператор информационной системы

Полный день
  • Москва

  • до 276000 RUR

СБЕР
Полный день
  • Москва

  • до 276000 RUR

Домклик
Удаленная работа
  • Москва

  • до 276000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию