Middle NLP Researcher (GigaCode R&D)

СБЕР

Middle NLP Researcher (GigaCode R&D)

Москва, Кутузовский проспект, 32

Метро: Кутузовская

Описание вакансии

Мы — команда GigaCode, разрабатываем и развиваем AI-ассистента для разработчика. Целимся конкурировать с Copilot, Cursor, Windsurf и прочими инструментами.

Обучаем новые SOTA LLM по работе с кодом, как на уровне подсказок в IDE, так и на уровне редактирования целого проекта. Мы R&D команда, поэтому мы не только заимствуем лучшие решения из публикаций, но и ведем собственные исследования, публикуем статьи, open-source инструменты и датасеты.

Наши основные направления: претрейн кодовых моделей с нуля, пост-тренировка моделей (SFT/DPO/GRPO), обучение рассуждающих моделей, дообучение работе в агентном режиме и использованию инструментов, поиск в коде по текстовым запросам, ускорение инференса, дизайн бенчмарков, автоматическое создание датасетов проверяемых задач.

Обучаем модели на картах H100, на кластере Кристофари, у нас много свободы в использовании GPU.

Обязанности

  • дизайн экспериментов, формулировка гипотез для улучшения NLP/PLP моделей и алгоритмов, планирование исследовательских экспериментов с выводами
  • проведение экспериментов, написание кода, подготовка датасетов и бенчмарков, проведение замеров и анализ результатов
  • обучение моделей на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей
  • взаимодействие с прод-командой для интеграции моделей и алгоритмов в продакшн. Взаимодействуем с командой инженеров SberWorks
  • ориентированность на SOTA, читать пейперы, быть в курсе последних исследований, предлагать новые смелые подходы и направления.

Требования

  • хорошие теоретические знания в DL, с упором в современный NLP и трансформеры
  • умение формулировать эксперименты с научной строгостью, обосновывать их, проводить самостоятельно и делать выводы
  • опыт обучения трансформеров
  • опыт распределенного обучения моделей (deepspeed, fsdp, torch.distributed, accelerate)
  • знание стандартных библиотек для DL и NLP (PyTorch и библиотеки Huggingface)
  • увлеченность NLP/PLP и DL
  • опыт менторинга стажеров и младших коллег.

Будет плюсом:

  • опыт работы на похожей позиции
  • участие в соревнованиях по ML
  • сабмиты на лидербордах по NLP/PLP
  • публикации уровня А/A*, Q1
  • обучение моделей на кластере
  • опыт управления командой исследователей.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы или удаленка из Москвы/МО
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Навыки
  • Python
  • LLM
  • NLP
  • SFT
  • PyTorch
  • ML
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Tevian (ООО Технологии видеоанализа)

Computer Vision Researcher (Junior+)

Tevian (ООО Технологии видеоанализа)

  • Москва

  • до 230000 RUR

Рекомендуем
Мамба
  • Москва

  • до 230000 RUR

Рекомендуем
DiagnoCat
  • Москва

  • до 4500 USD

Рекомендуем
Sifox
  • Москва

  • до 4500 USD

ADF Capital
  • Москва

  • до 4500 USD

СберПраво

NLP инженер

СберПраво

  • Москва

  • до 4500 USD

Smartis
  • Санкт-Петербург

  • до 210000 RUR

СБЕР
  • Москва

  • до 250000 RUR

СП Солюшен
  • Москва

  • до 250000 RUR

РСХБ-Интех
  • Москва

  • до 250000 RUR

Банк ВТБ (ПАО)

Middle \ Senior Data Scientist (LLM)

Банк ВТБ (ПАО)

  • Москва

  • до 250000 RUR

ПК РАД КОП
  • Москва

  • до 250000 RUR

ZennoLab
  • Москва

  • от 250000 RUR

  • Москва

  • от 250000 RUR

Лаборатория Касперского

Research Developer (OSMP)

Лаборатория Касперского

  • Москва

  • от 250000 RUR

Чиббис
  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию