Аналитик-разработчик (GigaChat Data)

СБЕР

Аналитик-разработчик (GigaChat Data)

Описание вакансии

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии.

Обязанности

  • cбор данных для alignment обучения моделей: Supervised Finetuning (SFT), Reinforcement Learning (RL, DPO , PPO, GRPO и пр.)
  • улучшение пайплайнов предобработки данных для разметки и обучения
  • работа в плотной связке с командой ML, LoRA-finetuning
  • взаимодействие с командой асессоров/ разметчиков (мониторинг качества, корректировка инструкций и пр.)
  • расчет метрик и принятие решений по улучшению качества данных на их основе.

Требования

  • знания Python на очень высоком уровне
  • опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, Google Gemini, OpenAI GPT, Anthropic и пр.)
  • понимание процессов работы с данными для больших языковых моделей

Будет плюсом:

  • опыт работы с LLM-агентами (LangChain, LangSmith, LangGraph, FAISS, RAG, ChromaDB и пр.).

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • льготная программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
Домклик

Data Scientist NLP

Домклик

Удаленная работа
  • Москва

  • Не указана

Яндекс Практикум
Гибкий график
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Ингосстрах

Data Scientist (риски)

Ингосстрах

Полный день
  • Москва

  • Не указана

Лемана ПРО
Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

X5 Tech
Удаленная работа
  • Москва

  • Не указана

X5 Tech
Полный день
  • Москва

  • Не указана

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Middle Data Scientist

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • Не указана

Ozon
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Детский мир

Data Scientist

Детский мир

Полный день
  • Москва

  • Не указана

Hi, Rockits!
Удаленная работа
  • Москва

  • Не указана

AMarkets

Data scientist

AMarkets

Полный день
  • Москва

  • Не указана

Ростелеком

Data Engineer ML

Ростелеком

Полный день
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию