Data Engineer (AI/LLM Data & Infrastructure)

Медиа Эффект

Data Engineer (AI/LLM Data & Infrastructure)

Описание вакансии

Предлагаем:

  • официальное оформление с первого рабочего дня;

  • заработная плата 180 000 рублей на руки;

  • график работы 5/2 с 9 до 18;

  • офис м. Нагатинская/м. Верхние Котлы;

  • компенсация питания;

  • полный социальный пакет.

Чем предстоит заниматься:

  • разработка, тестирование и поддержка ETL-пайплайнов для сбора, очистки, дедупликации и фильтрации обучающих корпусов;

  • парсинг разнородных документов в структурированные форматы, пригодные для обучения языковых моделей;

  • глубокий анализ больших объемов текстовых и структурированных данных, написание и оптимизация скриптов на Python и SQL;

  • полный цикл поддержки данных: от исследования источников и прототипирования парсеров до production-эксплуатации и мониторинга качества;

  • исследование и внедрение новых подходов в обработке данных для LLM: улучшение фильтрации шумов, оптимизация словарей, автоматизация evaluation-пайплайнов.

От Вас ожидаем:

  • глубокое понимание архитектуры данных, принципов построения ETL/ELT-пайплайнов и жизненного цикла данных для обучения AI-моделей;

  • свободное владение Python и основными библиотеками для обработки данных: Инженерия данных: Polars, Pandas, PyArrow, Dask/Spark Веб-скрапинг и парсинг: Scrapy, Playwright, BeautifulSoup, инструменты разбора документов * NLP-экосистема: Hugging Face Datasets, Tokenizers, NLTK, spaCy;

  • понимание принципов работы токенизаторов и архитектур LLM: опыт разработки или кастомизации токенизаторов, оптимизация словаря под русский язык, работа с subword-алгоритмами (BPE, Unigram, SentencePiece);

  • знание открытых и корпоративных источников данных, умение работать с лицензиями, авторскими правами и compliance при сборе обучающих корпусов;

  • наличие успешного опыта внедрения data-пайплайнов «под ключ» для NLP/LLM-проектов в production-среде.

Посмотреть контакты работодателя

Похожие вакансии

Медиа Эффект
  • Москва

  • от 210000 RUR

Рекомендуем
Медиа Эффект

Backend / AI Agent Engineer GO

Медиа Эффект

  • Москва

  • от 170000 RUR

Рекомендуем
OSMI IT
  • Москва

  • до 250000 RUR

Рекомендуем
ДАЛКОС
  • Москва

  • до 250000 RUR

Клиника АльтраВита (ООО ЭкоЦентр)

Системный инженер

Клиника АльтраВита (ООО ЭкоЦентр)

  • Москва

  • от 230000 RUR

СБЕР
  • Москва

  • от 180000 RUR

Diamond Personnel R&C

Data Engineer

Diamond Personnel R&C

  • Москва

  • от 200000 RUR

  • Москва

  • от 150000 RUR

ProfiStaff

ML Engineer

ProfiStaff

  • Москва

  • до 350000 RUR

Лига Цифровой Экономики

Data Engineer

Лига Цифровой Экономики

  • Москва

  • до 350000 RUR

СБЕР
  • Москва

  • до 180000 RUR

  • Москва

  • до 180000 RUR

Центральный банк Российской Федерации (Банк России)

Data аналитик (ПВР)

Центральный банк Российской Федерации (Банк России)

  • Москва

  • до 180000 RUR

Платформа ОФД

Data scientist (NLP) middle

Платформа ОФД

  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию