Привет! Это команда Инфраструктуры данных.
Мы занимаемся новым и активно развивающийся сервисом Feature Store, который:
- Хранит более 10 ПБ данных и исходные данные для обучения моделей.
- Используется командами поиска, рекомендаций, модерации и рекламы.
- Обрабатывает нагрузки в тысячи RPS.
- Является критически важной частью ML-инфраструктуры компании.
Мы ищем разработчика в команду инфраструктуры данных ML-платформы. Команда занимается созданием и развитием Feature Store - ключевого продукта для всех команд машинного обучения в компании.
Наш стэк
- Java, PostgreSQL, Kafka, Linux, Hadoop, Spark
Вы будете
- Разрабатывать и развивать высоконагруженные сервисы Feature Store.
- Проектировать и реализовывать надежные и масштабируемые решения для хранения и обработки данных.
- Осуществлять интеграцию с ML-пайплайнами и инфраструктурой данных.
- Оптимизировать производительность и отказоустойчивость системы.
- Участвовать в архитектурных решениях и техническом развитии платформы.
Нам важно
- Уверенное знание Java.
- Опыт разработки под Linux.
- Понимание принципов работы распределённых систем.
Будет плюсом
- Опыт работы с Hadoop, Spark.
- Знание Python и/или Go.
- Опыт работы с высоконагруженными сервисами и data-platform решениями.
- Понимание ML-инфраструктуры и жизненного цикла данных.