Middle/Senior Data Engineer — LLM (Muxlisa AI)

UZINFOCOM

Middle/Senior Data Engineer — LLM (Muxlisa AI)

Ташкент, улица Муминова, 7/1

Описание вакансии

Мы создаем национальную языковую модель (LLM) для узбекского языка с нуля — от разработки конвейеров данных до тонкой настройки (fine-tuning) и внедрения в продакшн. Мы ищем Data Engineer'а, который возьмет на себя полный жизненный цикл данных для LLM: сбор, очистку, валидацию, подачу в пайплайны обучения и поддержку систем RAG.

Обязанности:

  • Создание масштабируемых конвейеров данных для обучения, оценки LLM и систем RAG.

  • Сбор, очистка, нормализация, дедупликация, кластеризация и валидация огромных текстовых датасетов (новости, книги, веб-контент, юридические документы, разговорная речь).

  • Разработка автоматизированных систем проверки качества данных (фильтры, эвристики и ML-методы валидации).

  • Создание и поддержка инструментов для аннотирования, верификации и работы кураторов данных.

  • Подготовка датасетов для:

    • Instruction tuning (инструктивное обучение);

    • Supervised fine-tuning (SFT);

    • Генерации пар «вопрос-ответ»;

    • Задач перевода и суммаризации.

  • Коллаборация с ML-инженерами: участие в обучении токенизаторов, настройке LoRA / QLoRA, версионировании данных и отслеживании экспериментов.

  • Разработка пайплайнов RAG (ингестия документов, чанкинг, векторизация, поиск) и интеграция кастомных инференс-решений в продакшн.

  • Настройка рабочих процессов для максимально эффективного использования GPU при обучении и инференсе.

Требования:
  • Python: глубокие знания языка для обработки данных и построения ML-пайплайнов.

  • Уверенный опыт работы с PyTorch, HuggingFace Transformers и базовое понимание CUDA (достаточное для взаимодействия с ML-командой).

  • Практический опыт подготовки датасетов для LLM, работы с Instruction tuning и SFT.

  • Опыт работы с LangChain или LlamaIndex, понимание LoRA / QLoRA и процессов обучения токенизаторов.

  • Владение инструментами: Git, Docker.

  • Опыт работы с backend-фреймворками (FastAPI или аналогичными).

Условия:
  • График работы: 5 дней в неделю, с 09:00 до 18:00;
  • Оформление в соответствии с Трудовым кодексом РУз, предоставление 28 календарных дней отпуска;
  • Отсутствие строгого дресс-кода — мы стремимся разрушить стереотипы о государственных организациях;
  • Работа в сильной команде профессионалов, готовых делиться знаниями и опытом;
  • Участие в крупных и значимых проектах, направленных на создание сервисов для улучшения жизни населения и оптимизацию бизнес-процессов в ведущих предприятиях страны;
  • Широкие возможности для самостоятельных решений и активного влияния на развитие компании.

    Мы ждем вас в нашей команде, чтобы вместе достигать новых высот!
Навыки
  • Python
  • LLM
  • RAG
  • SFT
  • LoRA
  • QLoRA
  • GPU
  • PyTorch
  • HuggingFace Transformers
Посмотреть контакты работодателя

Адрес

Похожие вакансии

UZINFOCOM
  • Ташкент

  • Не указана

Рекомендуем
UZINFOCOM
  • Ташкент

  • Не указана

Рекомендуем
IT TA`LIM BERISH MARKAZI USTUDY

Senior Machine Learning Instruktori

IT TA`LIM BERISH MARKAZI USTUDY

  • Ташкент

  • до 25000000 UZS

Рекомендуем
Korzinka (Anglesey food)

Data Engineer (Korzinka Go)

Korzinka (Anglesey food)

  • Ташкент

  • до 25000000 UZS

  • Ташкент

  • до 25000000 UZS

AVO.UZ
  • Ташкент

  • до 25000000 UZS

Lead Data Engineer

Alif Uzbekistan

  • Ташкент

  • до 25000000 UZS

  • Ташкент

  • до 25000000 UZS

FlexSoft
  • Ташкент

  • до 25000000 UZS

  • Ташкент

  • до 25000000 UZS

SUEZ INTERNATIONAL SAS
  • Ташкент

  • до 25000000 UZS

TARGET-INTERNATIONAL SCHOOL
  • Ташкент

  • до 15000000 UZS

REALSOFT
  • Ташкент

  • до 15000000 UZS

Аналитик данных (Data analyst) в управление организации и проведения процессов переписи

Национальный комитет Республики Узбекистан по статистике

  • Ташкент

  • до 15000000 UZS

FULL STACK SOLUTION

SRE-инженер

FULL STACK SOLUTION

  • Ташкент

  • до 15000000 UZS

ML-инженер

LIKE MASTER PRO

  • Ташкент

  • до 3000 USD

Капиталбанк
  • Ташкент

  • до 3000 USD

ISHONCH KREDIT SAVDO
  • Ташкент

  • до 20000000 UZS

BELLISSIMO PIZZA INTERNATIONAL

ML Engineer

BELLISSIMO PIZZA INTERNATIONAL

  • Ташкент

  • до 20000000 UZS

Ведущий специалист (Экономист – аналитик данных)

Национальный комитет Республики Узбекистан по статистике

  • Ташкент

  • до 12000000 UZS

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию