SberDevices — инновационное направление компании, которое создает умные устройства, виртуальные ассистенты и другие продукты в области NLP, gamedev, computer vision.
Команда Поиска ищет Аналитика-инженера в MusicSearch. Мы создаем поисковый движок, который позволяет ассистенту на устройствах находить нужный трек, исполнителя, плейлист или подкаст.
Инженер данных в нашей команде — это человек, который строит “платформу качества”: собирает и сводит данные из разных источников, делает витрины и датасеты для оценки, автоматизирует пайплайны и мониторинг, в том числе — в реальном времени, чтобы деградации находились быстрее, чем их увидят пользователи.
Если вам интересно работать на стыке data engineering, продуктовой аналитики и поиска — и вы хотите не просто “переливать данные”, а делать инфраструктуру, на которой стоит культура качества AI-продукта — приходите к нам.
Обязанности
- ответственность за оценку качество поиска
- планирование и проведение экспериментов и АБ-тестирования для сравнения моделей
- построение пайплайнов оценки и переоценки качества (включая LLM-as-a-judge) и их поддержка
- витрины и датасеты для оффлайн/онлайн-оценки, A/B-экспериментов и расследований деградаций
- мониторинг качества данных на потоке: свежесть, полнота, задержки, аномалии, регрессии.
Требования
- опыт в data engineering / analytics engineering от 3 лет (уровень middle+ / senior)
- очень сильный SQL и практический опыт построения витрин (ClickHouse и/или PostgreSQL; оконные функции, сложные агрегации, оптимизация)
- уверенный Python для задач ETL/ELT (парсинг, валидация, интеграции, утилиты для пайплайнов)
- опыт работы с оркестраторами задач (предпочтительно Airflow) для построения и поддержки пайплайнов;
- хорошее понимание архитектуры данных и жизненного цикла датасетов (raw → нормализация → витрины), умение делать решения поддерживаемыми
- способность закрывать задачу «от данных в разных местах» до стабильной витрины/пайплайна/алерта.
Будет плюсом:
- dbt или аналогичный подход к управлению SQL-моделями (тесты, документация, зависимости)
- опыт с логами поиска/клика (показы выдачи, клики, сессии, dwell time) и склейкой событий
- опыт построения мониторинга/дашбордов (Grafana / Superset / DataLens)
- опыт с Kafka/очередями, Kubernetes, Terraform/Ansible, CI/CD для data-проекта
- знакомство с OpenSearch/Elastic как компонентом поисковой системы.
Условия
- гибридный формат работы (м Новослободская)
- годовая премия
- корпоративный спортзал и зоны отдыха
- более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
- регулярные митапы и развитое DS-community
- расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
- гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
- бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
- вознаграждение за рекомендацию друзей в команду Сбер.