Team Lead Data Engineer (GigaData)

СБЕР

Team Lead Data Engineer (GigaData)

Описание вакансии

Проект: Создаем поисковый сервис для ответа на запросы пользователей на естественном языке. Ломаем барьер между статичными знаниями языковой модели и постоянно меняющимся миром. Предоставляем GigaChat доступ к актуальной информации, чтобы пользователи получали точные ответы на любые вопросы, включая вопросы о свежих новостях и событиях.

Обязанности

  • разрабатывать и настраивать механизмы для автоматизированного сбора данных, обеспечивать корректность и полноту сбора, оптимизировать процессы таким образом, чтобы все работало быстрее и без ручного вмешательства
  • декомпозировать и ставить задачи для команды data инженеров, приоритизировать бэклог
  • разрабатывать MapReduce и потоковые пайплайны для предобработки данных и преобразовывать их в формат, оптимальный для дальнейшего хранения, обработки и использования в задачах поиска.
  • проектировать и реализовывать хранилища, которые позволили бы эффективно решать задачи поиска.
  • применять машинное обучение и искусственный интеллект для улучшения результатов работы, поддерживать корректную работу системы – мониторинг, диагностика и устранение неполадок, исправление старых багов и создание новых.

Требования

  • роль техлида команды из 3 инженеров: архитектура, распределение задач, контроль качества
  • умение проектировать DWH, Data Lake, Data Management Platform
  • понимание устройства векторных и полнотекстовых индексов
  • опыт разработки и оптимизации высоконагруженных пайплайнов (batch, streaming) для обработки больших объемов данных (100TB - 1PB+)
  • продвинутый уровень владения Python и SQL
  • опыт работы с движками для распределенной обработки данных (Spark, Trino), оркестраторы Airflow

Будет плюсом

  • опыт работы с таблицами формата Iceberg
  • опыт работы с GPU (инференс моделей).
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
  • Москва

  • Не указана

Рекомендуем
СБЕР
  • Москва

  • Не указана

Рекомендуем
Детский мир
  • Москва

  • Не указана

Рекомендуем
Мокка
  • Москва

  • Не указана

Цифровой аудит

Lead Data Engineer

Цифровой аудит

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

Центральный банк Российской Федерации (Банк России)

Lead/Senior ML Engineer (NLP/RAG)

Центральный банк Российской Федерации (Банк России)

  • Москва

  • Не указана

SDI Research
  • Москва

  • Не указана

Lead Data Scientist

Кадровое Агентство ОК Консалт

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

585, Холдинг

AI Lead

585, Холдинг

  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

  • Москва

  • Не указана

БФТ-Холдинг
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию