Data Engineer (AI/LLM Data & Infrastructure)

Data Engineer (AI/LLM Data & Infrastructure)

Показать контакты

Описание вакансии

Предлагаем:

официальное оформление с первого рабочего дня;
заработная плата 180 000 рублей на руки;
график работы 5/2 с 9 до 18;
офис м. Нагатинская/м. Верхние Котлы;
компенсация питания;
полный социальный пакет.

Чем предстоит заниматься:

разработка, тестирование и поддержка ETL-пайплайнов для сбора, очистки, дедупликации и фильтрации обучающих корпусов;
парсинг разнородных документов в структурированные форматы, пригодные для обучения языковых моделей;
глубокий анализ больших объемов текстовых и структурированных данных, написание и оптимизация скриптов на Python и SQL;
полный цикл поддержки данных: от исследования источников и прототипирования парсеров до production-эксплуатации и мониторинга качества;
исследование и внедрение новых подходов в обработке данных для LLM: улучшение фильтрации шумов, оптимизация словарей, автоматизация evaluation-пайплайнов.

От Вас ожидаем:

глубокое понимание архитектуры данных, принципов построения ETL/ELT-пайплайнов и жизненного цикла данных для обучения AI-моделей;
свободное владение Python и основными библиотеками для обработки данных: Инженерия данных: Polars, Pandas, PyArrow, Dask/Spark Веб-скрапинг и парсинг: Scrapy, Playwright, BeautifulSoup, инструменты разбора документов * NLP-экосистема: Hugging Face Datasets, Tokenizers, NLTK, spaCy;
понимание принципов работы токенизаторов и архитектур LLM: опыт разработки или кастомизации токенизаторов, оптимизация словаря под русский язык, работа с subword-алгоритмами (BPE, Unigram, SentencePiece);
знание открытых и корпоративных источников данных, умение работать с лицензиями, авторскими правами и compliance при сборе обучающих корпусов;
наличие успешного опыта внедрения data-пайплайнов «под ключ» для NLP/LLM-проектов в production-среде.

Посмотреть контакты работодателя

Зарплата
от 180000 RUR
Занятость
,
Опыт работы
От 1 года до 3 лет
Дата размещения:
26.06.2026 03:55:23

Похожие вакансии

Pre-train ML Engineer (LLM Development & Optimization)

Медиа Эффект

Москва
от 210000 RUR

Рекомендуем

Backend / AI Agent Engineer GO

Медиа Эффект

Москва
от 170000 RUR

Рекомендуем

LLM-engineer/специалист по интеграции RAG-систем

OSMI IT

Москва
до 250000 RUR

Рекомендуем

Инженер по ИИ

ДАЛКОС

Москва
до 250000 RUR

Системный инженер

Клиника АльтраВита (ООО ЭкоЦентр)

Москва
от 230000 RUR

Аналитик данных middle / GenAI LLM + RAG / ML инженер данных / CV / Data Science

Мейджерпак Рус

Москва
от 230000 RUR

Ведущий инженер-проектировщик (освещение и системы автоматизации)

Lightmans

Москва
от 180000 RUR

Senior Data Scientist в Центр компетенций по внедрению ИИ-агентов

СБЕР

Москва
от 180000 RUR

Senior NLP Data Scientist (команда AI Phygital)

СБЕР

Москва
от 180000 RUR

Data Engineer

Diamond Personnel R&C

Москва
от 200000 RUR

Инженер-конструктор

Спалюстек

Москва
от 150000 RUR

ML Engineer

ProfiStaff

Москва
до 350000 RUR

Data Scientist / ML Researcher (Оценка и улучшение качества Ai агентов)

СБЕР

Москва
до 350000 RUR

Data Engineer

Лига Цифровой Экономики

Москва
до 350000 RUR

Продуктовый (data) аналитик "Защитные страховые продукты и сервисы"

СБЕР

Москва
до 350000 RUR

Middle Data Analyst (команда Операционной аналитики)

СБЕР

Москва
до 350000 RUR

Инженер-технолог

ВСЕСВЕТОДИОДЫ

Москва
до 180000 RUR

Разработчик AI-агентов (SkyNet)

СБЕР

Москва
до 180000 RUR

ML-инженер

EvoAI

Москва
до 180000 RUR

Data scientist (NLP) middle

Платформа ОФД

Москва
до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.

Оставить вакансию