Senior/Lead NLP/PLP Researcher (GigaCode R&D)

СБЕР

Senior/Lead NLP/PLP Researcher (GigaCode R&D)

Описание вакансии

Мы — команда GigaCode, разрабатываем и развиваем AI-ассистента для разработчика. Целимся конкурировать с Copilot, Cursor, Windsurf и прочими инструментами. Подробнее о нашем продукте на сайте (https://gigacode.ru/).

Обучаем новые SOTA LLM по работе с кодом, как на уровне подсказок в IDE, так и на уровне редактирования целого проекта. Мы R&D команда, поэтому мы не только заимствуем лучшие решения из публикаций, но и ведем собственные исследования, публикуем статьи, open-source инструменты и датасеты.

Наши основные направления: претрейн кодовых моделей с нуля, пост-тренировка моделей (SFT/DPO/GRPO), обучение рассуждающих моделей, дообучение работе в агентном режиме и использованию инструментов, поиск в коде по текстовым запросам, ускорение инференса, дизайн бенчмарков, автоматическое создание датасетов проверяемых задач.

Обучаем модели на картах H100, на кластере Кристофари, у нас много свободы в использовании GPU.

Обязанности

  • дизайн экспериментов, формулировка гипотез для улучшения NLP/PLP моделей и алгоритмов, планирование исследовательских экспериментов с выводами
  • проведение экспериментов, написание кода, подготовка датасетов и бенчмарков, проведение замеров и анализ результатов
  • обучение моделей на кластере, включая обучение моделей с нуля и дообучение опенсорс моделей
  • взаимодействие с прод-командой для интеграции моделей и алгоритмов в продакшн. Взаимодействуем с командой инженеров SberWorks
  • ориентированность на SOTA, читать пейперы, быть в курсе последних исследований, предлагать новые смелые подходы и направления.

Требования

  • хорошие теоретические знания в DL, с упором в современный NLP и трансформеры
  • умение формулировать эксперименты с научной строгостью, обосновывать их, проводить самостоятельно и делать выводы
  • опыт обучения трансформеров
  • опыт распределенного обучения моделей (deepspeed, fsdp, torch.distributed, accelerate)
  • знание стандартных библиотек для DL и NLP (PyTorch и библиотеки Huggingface)
  • увлеченность NLP/PLP и DL
  • опыт менторинга стажеров и младших коллег.

Будет плюсом:

  • опыт работы на похожей позиции
  • участие в соревнованиях по ML
  • сабмиты на лидербордах по NLP/PLP
  • публикации уровня А/A*, Q1
  • обучение моделей на кластере
  • опыт управления командой исследователей.

Условия

  • комфортный современный офис рядом с м. Кутузовская
  • гибридный формат работы
  • ежегодный пересмотр зарплаты, годовая премия
  • корпоративный спортзал и зоны отдыха
  • система обучения для профессионального и карьерного развития
  • расширенный полис ДМС с первого дня работы и страхование для семьи
  • программа ипотеки для сотрудников
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

Рекомендуем
СБЕР
Полный день
  • Москва

  • Не указана

WILDBERRIES
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

X5 Digital
Полный день
  • Москва

  • Не указана

Яндекс
Полный день
  • Москва

  • Не указана

HeadHunter
Удаленная работа
  • Москва

  • Не указана

Цифровой аудит

Tech Lead (ML/DL)

Цифровой аудит

Полный день
  • Москва

  • Не указана

Электронная торговая площадка Газпромбанка

Senior MLOps

Электронная торговая площадка Газпромбанка

Удаленная работа
  • Москва

  • Не указана

Программный Продукт, ИТ-компания

Технический лидер (AI Team Lead)

Программный Продукт, ИТ-компания

Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Транснефть-Технологии

NLP разработчик

Транснефть-Технологии

Полный день
  • Москва

  • Не указана

Транснефть-Технологии

Data Scientist NLP (Senior)

Транснефть-Технологии

Полный день
  • Москва

  • Не указана

ML Engineer / Computer Vision Middle / Senior

Сальникова Ксения Григорьевна

Удаленная работа
  • Москва

  • Не указана

Servicepipe

Senior ML developer

Servicepipe

Удаленная работа
  • Москва

  • Не указана

Делимобиль
Удаленная работа
  • Москва

  • Не указана

Джемини Софт

Lead ML Engineer (AI Tech Lead)

Джемини Софт

Удаленная работа
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию