Инженер данных для ИИ

Глобус, Сеть гипермаркетов

Инженер данных для ИИ

Москва, Смольная, 14

Метро: Речной вокзал

Описание вакансии

Обязанности:

1. Разработка data-pipeline и инфраструктуры

  • Проектировать архитектуру обработки данных (batch / streaming)
  • Разрабатывать и поддерживать ETL/ELT-процессы
  • Обеспечивать надежную доставку данных в ML/LLM-системы
  • Развивать Data Lake / Data Warehouse
  • 2. Работа с данными для ML/LLM

  • Подготавливать датасеты для обучения, тестирования и инференса
  • Подготавливать данные для RAG (документы, базы знаний, тексты)
  • Выполнять очистку, нормализацию, дедупликацию и обогащение данных
  • Работать с неструктурированными данными (тексты, PDF, логи, аудио)
  • 3. Качество данных и валидация

  • Разрабатывать системы контроля качества данных (data quality)
  • Внедрять проверки в пайплайны (validation, schema checks)
  • Обеспечивать консистентность и целостность данных
  • Анализировать причины деградации качества данных
  • 4. Интеграция и работа с бизнесом

  • Интегрировать данные из ERP, CRM и других систем
  • Взаимодействовать с бизнес-подразделениями
  • Формализовывать и структурировать знания компании
  • Подготавливать документацию в формат, пригодный для ИИ
  • 5. Оптимизация и продакшен

  • Оптимизировать производительность обработки данных
  • Учитывать latency, throughput и стоимость обработки
  • Обеспечивать масштабируемость решений
  • Участвовать в эксплуатации data-сервисов в продакшене
  • 6. Data-процессы и воспроизводимость

  • Строить воспроизводимые пайплайны (данные + код + конфигурации)
  • Версионировать данные и процессы
  • Документировать архитектуру и data-flow
  • Обеспечивать стабильность data lifecycle

Ожидаем от вас знаний и опыта:

  • Архитектуры данных;
  • Data Lake / Data Warehouse;
  • Методов интеграции данных;
  • Подготовки данных для ML;
  • Контроля качества данных;
  • Основ распределенных систем;
  • Разработки data-pipeline;
  • ETL/ELT;
  • Очистки и трансформации данных;
  • Data quality систем;
  • Подготовки датасетов для ML/LLM;
  • Работа с Git;
  • Docker / CI/CD.

​​​Условия:

  • График работы гибридный (посещение офиса 2 дня в неделю);
  • Дополнительная ежеквартальная премия;
  • Оформление в соответствии с ТК РФ в IT аккредитованную компанию;
  • Кафетерий льгот на выбор (питание, спорт-карта, ДМС);
  • 10% скидки на покупки в магазинах, бонусы по корпоративной карте лояльности.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Марс
  • Москва

  • Не указана

Рекомендуем
Программный Продукт, ИТ-компания

Аналитик данных

Программный Продукт, ИТ-компания

  • Москва

  • Не указана

Рекомендуем
ING BANK (EURASIA) JSC

Аналитик данных

ING BANK (EURASIA) JSC

  • Москва

  • Не указана

Рекомендуем
Тера Интегро

Data engineer (DBT)

Тера Интегро

  • Москва

  • Не указана

Технопром

Аналитик данных

Технопром

  • Москва

  • Не указана

Rostic’s (Интернэшнл Ресторант Брэндс)

Старший Дата-инженер

Rostic’s (Интернэшнл Ресторант Брэндс)

  • Москва

  • Не указана

Corporate Performance Systems

Data Engineer

Corporate Performance Systems

  • Москва

  • Не указана

АйФокс Груп
  • Москва

  • Не указана

Эдвансд
  • Москва

  • Не указана

Платформа Третье Мнение

Инженер данных (Data Engineer)

Платформа Третье Мнение

  • Москва

  • Не указана

АльфаСтрахование

Data Engineer

АльфаСтрахование

  • Москва

  • Не указана

Цифровой аудит
  • Москва

  • Не указана

СБЕР
  • Москва

  • Не указана

ББР Банк
  • Москва

  • Не указана

Платформа ОФД

Data Engineer (Big Data) Scala

Платформа ОФД

  • Москва

  • до 220000 RUR

Кофемания
  • Москва

  • до 200000 RUR

Инсейлс Рус

Аналитик данных

Инсейлс Рус

  • Москва

  • до 200000 RUR

R-Style Softlab (Эр-Стайл Софтлаб)
  • Москва

  • до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию