Мы ищем инженера в команду DataSoft, которая обеспечивает инфраструктуру для MLOps и DATAOps команд. Предоставляет сервисы, платформы и тулы, направленные на последовательное и эффективное внедрение и поддержку моделей машинного обучения (ML).
Чем предстоит заниматься:
- Внедрять и развивать инструменты для работы Data Engineering и Data Analytics;
- Разрабатывать и развивать решения “as a Service”/”as a Platform”;
- Участвовать в локализации инцидентов, устранять их последствия;
- Автоматизировать процессы и рутину;
- Строить качественный и понятный мониторинг для сервисов.
От успешного соискателя мы ожидаем:
- Опыта работы/понимания принципов и устройства k8s;
- Знания DevOps практик;
- Понимания концепции хранилищ данных и ETL-процессов;
- Понимания особенностей приложений дата слоя;
- Опыта работы с системами управления конфигурациями (преимущественно Ansible);
- Уверенных отношений с Prometheus/VictoriaMetrics+Grafana;
- Умения работать в кросс-командных коммуникациях;
- Желания нести порядок в инфраструктуру дата слоя.
Будет плюсом:
- Опыт работы с Kubernetes/ArgoCD;
- Уверенное владение Helm;
- Опыт настройки CI/CD и работы с любым CI инструментом (Jenkins, gitlab-ci, teamcity).
Стек:
- BigData: JupyterHub, MLflow, Triton, Trino, Hive-Metastore, OpenMetaData;
- DBMS: PostgreSQL, MSSQL, GreenPlum, ClickHouse, Cassandra, Scylla, Redis, MongoDB, Hadoop;
- Orchestrator: Airflow;
- CI/CD: GitLab, ArgoCD, ArgoFlow;
- ConfigManagment: Ansible;
- Service Languages: Go, Python;
- Data Languages: Python, Spark;
- ObjectStorage: Minio.