Мы — команда, разрабатывающая аналитическую платформу. Одна из задач команды – объединить аналитику, обучение моделей и их внедрение в продукт для различных команд Авиасейлс на базе дата платформы. Наша цель – создать универсальную структуру, которая позволит эффективно интегрировать разные модели.
Что нужно будет делать:
проектирование и сопровождение дата пайплайнов необходимых для работы МЛ платформы;
разработка и поддержка офлайн (batch) сервисов обучения и инференса ML-моделей;
деплоить модели в продакшн, обеспечивать их стабильность работы и масштабируемость, разрабатывать систему мониторинга;
анализировать качество моделей;
сотрудничать с разными командами разработки и аналитики для интеграции моделей в прод.
опыт работы в Data Engineering/ML не менее 3 лет;
уверенное владение SQL, Python. Понимание Lakehouse концепций;
опыт работы с построением моделей (линейные/деревянные модели, ансамбли) для разных задач (регрессия, классификация, кластеризация, временные ряды и так далее);
навыки работы с контейнерами (Docker, Kubernetes), CI/CD(Jenkins), мониторингом (Prometheus, Grafana);
желание и способность работать в команде, обмениваться знаниями и опытом.
Будет плюсом:
опыт с Apache Airflow, DBT, Apache Spark, Trino, Kafka, ClickHouse, S3, MLFlow;
умение анализировать качество моделей с использованием различных классических и кастомных метрик;
опыт работы с большими объемами данных и оптимизацией производительности моделей.
Как мы работаем:
в любой точке мира: не привязываемся к локации, платим в долларах, любим путешествовать;
без бюрократии: удобные процессы здорового человека, горизонтальные и открытые коммуникации, быстрое обсуждение идей и принятие решений;
компенсируем: ДМС, психотерапию или иностранные языки, занятия спортом и больничный;
на райском острове: можно работать на Пхукете с видом на океан.
Москва
до 250000 RUR