Что будем делать на стажировке : разработка и вывод в промышленный контур процессов расчетов витрин (ETL), обеспечение данными процесса создания ML-моделей и ИИ-агентов. Вакансия стажёр Data Engineer
Обязанности
- вывод в промышленный контур ETL- пайплайнов расчета витрин (на основе кода на pyspark, spark+scala)
- анализ логов и метрик, выявление и решение проблем в ПРОМ среде
- обработка и поставка данных для исследования в Лабораторный контур
- создание процедур контроля качества данных.
Требования
- обязательно - техническая специальность
- знание языка программирования (желательно python или java или scala)
- желание развиваться в инженерии данных
- понимание основ работы с инструментам разработки GIT, DevOps
- знание SQL и основ работы с данными.
Будет плюсом:
- навыки работы с pyspark или spark.
Условия
- оплачиваемая стажировка
- длительность стажировки 3 месяца (20-40 часов в неделю)
- комфортный, современный офис: Москва, Кутузовский пр.32, к.1
- офисный формат работы, пн-пт с 9:00 до 18:00.