NLP Engineer (GigaChat Pretrain)

СБЕР

NLP Engineer (GigaChat Pretrain)

Описание вакансии

Мы команда GigaChat - создаём и развиваем core-технологию генеративной языковой модели. Она может писать тексты, создавать изображения и даже код на Python. Она умеет отвечать на вопросы, вести диалог, сочинять стихи и рассказы, придумывать идеи для бизнеса, писать письма и многое другое.

Наша команда осенью выпустила сильную русскоязычную модель GigaChat MAX уровня GPT-4 (метрики в статье), а этой зимой выложили в открытый доступ одну из наших MoE-моделей.

Мы ведем набор на 4 направления:

1. Разработку фреймворка распределенного обучения GigaFSDP, исследование обучений в FP8

2. Развитие метрик качества GigaChat-a, например, через оценку способности решать задачи олимпиад международного уровня

3. Команду инфраструктуры обучений, 5-D параллелизм, в том числе ускорение обучений мультимодальных моделей

4. Разработку низкоуровневых оптимизаций операций на аппаратном уровне

На эти роли мы ищем талантливого NLP Engineer, с которым мы будем вместе совершенствовать и развивать GigaChat. Для всех этих экспериментов у нас есть кластер с большим числом A/H 100'ых.

Обязанности

  • довести качество до ChatGPT на русском и дальше обогнать его
  • помогать решать бизнес-задачи с помощью нашей технологии сначала для внутренних клиентов в Сбере, а потом и внешним
  • придумывать и внедрять новые применения для LLM
  • помогать выводить в прод все, что мы обучим
  • постоянно держаться up-to-date со свежими статьями.

Требования

  • уверенное владение Python, Pytorch
  • знание базовых алгоритмов и математики
  • знания в DL, опыт обучения просто моделей и больших моделей
  • опыт обучения моделей для продакшен
  • понимание текущего состояния эволюции больших LLM's
  • навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом
  • опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов.

Условия

  • удаленный формат работы по России
  • годовая премия
  • корпоративный спортзал и зоны отдыха
  • более 400 образовательных программ СберУниверситета для профессионального и карьерного развития
  • расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа
  • гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ
  • бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров
  • вознаграждение за рекомендацию друзей в команду Сбера.
Посмотреть контакты работодателя

Похожие вакансии

Платформа Третье Мнение

NLP Engineer

Платформа Третье Мнение

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
МАГНИТ, Розничная сеть

Middle NLP-инженер в команду Copilot

МАГНИТ, Розничная сеть

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
VS Robotics (ООО АБТ)

ML Engineer (Speech)

VS Robotics (ООО АБТ)

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Data Scientist NLP (AI-Агенты)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Удаленная работа
  • Москва

  • Не указана

Звук
Удаленная работа
  • Москва

  • Не указана

Лаборатория Наносемантика

Data Scientist NLP Senior

Лаборатория Наносемантика

Удаленная работа
  • Москва

  • Не указана

Октопустех

ML-инженер

Октопустех

Удаленная работа
  • Москва

  • Не указана

VK
Удаленная работа
  • Москва

  • Не указана

WILDBERRIES
Удаленная работа
  • Москва

  • Не указана

Rocket Science
Удаленная работа
  • Москва

  • Не указана

POSCREDIT

Cv-engineer

POSCREDIT

Удаленная работа
  • Москва

  • от 250000 RUR

OneTwoTrip
Удаленная работа
  • Москва

  • от 250000 RUR

Marfatech

MLOps Engineer

Marfatech

Удаленная работа
  • Москва

  • от 250000 RUR

STARTRIBE LTD

Team Lead (AI, NLP, LLM)

STARTRIBE LTD

Удаленная работа
  • Москва

  • от 250000 RUR

STARTRIBE LTD

Lead ML Engineer

STARTRIBE LTD

Удаленная работа
  • Москва

  • от 250000 RUR

Диджитал Лайн

AI Engineer

Диджитал Лайн

Удаленная работа
  • Москва

  • от 250000 RUR

Удаленная работа
  • Москва

  • от 250000 RUR

Альфа-Банк

Middle/Senior ML-инженер

Альфа-Банк

Удаленная работа
  • Москва

  • от 250000 RUR

Flowwow
Удаленная работа
  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию