ML-engineer GigaChat Search Alignment

СБЕР

ML-engineer GigaChat Search Alignment

Описание вакансии

Мы - команда ML-инженеров GigaChat Data. Наша команда готовит данные для обучения всей линейки моделей LLM GigaChat (GigaChat, GigaChat Vision, GigaChat Audio, Giga Embeddings и др.). Мы собираем данные как для базовых моделей, так и для их адаптации под конкретные сценарии:

• Core модели – базовые модели

• продукты B2C – WEB-версия GigaChat, персонализированные интеллектуальные ассистенты и пр.

• внутренние банковские задачи – автоматизация обработки документов, анализ финансовых данных, поддержка сотрудников и пр.

• внешние заказчики – кастомные решения для корпоративных клиентов, интеграция LLM в бизнес-процессы и пр.

Обязанности

  • внедрение сервиса поиска в работу GigaChat
  • собирать данные для alignment-обучения LLM: Supervised Finetuning (SFT), Reinforcement Learning (DPO, PPO, GRPO и др.)
  • улучшать пайплайны предобработки данных: автоматизация фильтрации, очистки и подготовки для разметки
  • работать в плотной связке с ML-командой: LoRA-finetuning, проверка экспериментальных гипотез, анализ результатов
  • взаимодействовать с командой асессоров/разметчиков: мониторинг качества, корректировка инструкций, настройка разметки (включая SBS/side-by-side)
  • рассчитывать метрики и принимать решения по улучшению качества данных, сравнивая с конкурентами (Perplexity, OpenAI (ChatGPT Search), DeepSeek, YandexGPT (Яндекс Нейро) и пр.)
  • развивать комплекс DeepResearch: создавать глубокие отчёты по пользовательским запросам и бизнес-аналитике.

Требования

  • отличное знание Python и опыт работы с проприетарными и open-source LLM (Llama, Mistral, Qwen, GPT, Anthropic и т. д.)
  • понимание процессов подготовки данных и их использования в больших языковых моделях: фильтрация, шлифовка, версия датасетов
  • навыки в построении пайплайнов для SFT/RL, настройке LoRA-finetuning и работе над многозадачными проектами
  • опыт работы с одной или несколькими модальностями (аудио, vision, видео и пр.)

Будет плюсом:

  • опыт с LLM-агентами и фреймворками: LangChain, LangSmith, LangGraph, GraphRAG, GPTIndex, FAISS, RAG, ChromaDB и т. п.
  • опыт работы в поисковых проектах (интеграция поисковых движков, настройка ранжирования, работа с бэкендом поиска).

Условия

  • комфортный офис в Москве на Кутузовском проспекте (Sber City)
  • возможность выбрать удобный график – офис/гибрид
  • ежегодный пересмотр зарплаты и годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • ипотека для сотрудников выгоднее до 4%
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию