VK Data Platform — универсальная платформа для end‑to‑end работы с большими объёмами данных и машинным обучением. Выступает в роли единого окна для доступа и управления корпоративными данными и инфраструктурой. Единый слой управления платформой и запуск компонентов на базе Kubernetes.
Задачи
- Взаимодействие с заказчиками и партнёрами для выявления и фиксации их потребностей и уточнения требований к решению
- Участие в анализе документации, предоставляемой заказчиком: опросники, ФТТ, ТЗ, документация по текущему решению для сценариев миграции и т. п.
- Участие в выборе технологий, проведение архитектурных сессий, разработка архитектуры решения и интеграции, согласование архитектурных и проектных решений
- Участие в разработке технической документации: ТЗ, ТКП, оценка необходимых серверных мощностей и др.
- Участие в заполнении опросников по продуктам Дата Платформы VK Tech, подготовке демостендов и разработке PoC (прототипов) систем с использованием технологий VK Tech
- Участие в реализации проектов, демонстрациях и приёмо-сдаточных испытаниях
- Диагностика технических, инфраструктурных, функциональных проблем (совместно с аналитиками и QA) и принятие мер по их устранению
- Сопровождение и консультирование ключевых клиентов и партнёров, архитектурный надзор
- Взаимодействие с командами продуктов, продаж и смежными проектными командами
Требования
- Опыт работы в роли архитектора от трёх лет
- Опыт работы с Enterprise-заказчиками
- Опыт работы с DWH, Data Lake, Data Lakehouse, понимание паттернов, инструментов и методов проектирования хранилищ данных
- Опыт построения NRT/streaming решений и основных инструментов (Flink, Kafka, NiFi, Kafka Streams, Spark Streaming)
- Знание набора OpenSource-технологий для построения хранилищ данных (Hadoop, Spark, Airflow, NiFi, Kafka, Flink, Clickhouse, Greenplum, Iceberg, Trino)
- Знание SQL, Python, Scala/PySpark
- Опыт создания решений управления данными, контроля качества (Data Quality) и доставки данных, Data Governance. Знание каталогов данных на базе OpenMetaData или DataHub
- Умение документировать архитектурные решения
- Понимание основ ИБ и защиты проектируемых решений
- Опыт работы с технологиями виртуализации и контейнеризации, а также с системами хранения данных в средах виртуализации
- Навыки работы с инструментарием архитектора: Jira, Confluence, GitLab, Draw.io/Visiо
Будет плюсом
- Опыт работы с инструментами Ansible, Terraform
- Знания в области Machine Leaning, LLM, организации MLOps-процессов, понимание жизненного цикла моделей и интеграции с хранилищем
- Опыт работы с облачными продуктами и технологиями
- Опыт работы с SAP, Vertica, Exadata, Informatica, а также BI-инструментами
- Опыт в организации DevOps, DataOps
- Опыт разработки, проектирования или поддержки высоконагруженных и распределённых систем, cloud-native приложений, интеграционных решений
- Опыт работы с Grafana и другими системами мониторинга