Разработчик на C++ в YandexGPT (Нейро)

Яндекс

Разработчик на C++ в YandexGPT (Нейро)

Описание вакансии

Наша команда разрабатывает и развивает бэкенды на основе LLM-моделей (под брендом YandexGPT/Алиса). Мы занимаемся непосредственно инференсом на GPU-ускорителях, а также огромным спектром вопросов, связанных с развитием и поддержкой продукта: API взаимодействия с фронтендом, реализацией ML-стека в рантайме, логами для аналитики и многим другим. Вместе с нами вы сможете поработать над сложными и разнообразными задачами.

Какие задачи вас ждут

Инференс тяжёлых языковых генеративных моделей на GPU-ускорителях
Сердце LLM-based-продуктов — это, конечно, непосредственное вычисление LLM-моделей. Вас ждёт решение задач аллокации различных компонентов с LLM-моделями, настройка их взаимодействия, релизных процессов, подбор различных параметров для оптимизации.

Оптимизация методов распределения работы между вычислительными узлами
Можно оптимизировать не только само вычисление, но и методы разделения входящего потока между узлами, чтобы добиться наиболее выгодного по latency распределения работы между узлами. Также мы экспериментируем с отложенным продолжением вычислений.

Разработка различных кусков многокомпонентной системы
Ответ на основе поисковых источников — сложный многокомпонентный продукт. Важно не только вычислить что-то с помощью LLM-модели, но и: 1) приносить данные на вход модели; 2) правильно сохранять результаты для отдачи их пользователям; 3) настраивать взаимодействие с фронтендом (стриминг, например); 4) обеспечивать продуктовым и ML-командам возможность проводить эксперименты и улучшать продукт. Всё вместе порождает немало содержательных и сложных задач. Работа в бэкенде поисковых LLM открывает много технических вызовов, менее привычных в продуктах, которые не работают с LLM-моделями. Ведь вычисления, длящиеся не сотни миллисекунд, а многие секунды, требуют пересмотра устоявшихся подходов.

Мы ждем, что вы

  • Разбираетесь в базовых алгоритмах и структурах данных
  • Хорошо знаете С++
  • Знакомы с паттернами и идиомами построения программного обеспечения
  • Умеете писать надёжный и читабельный многопоточный код
  • Разрабатывали большой сервис в команде
Посмотреть контакты работодателя

Похожие вакансии

YADRO
  • Санкт-Петербург

  • Не указана

Рекомендуем
YADRO
  • Санкт-Петербург

  • Не указана

Рекомендуем
2ГИС
  • Санкт-Петербург

  • Не указана

Рекомендуем

Разработчик C++

ИКС ЛАБЗ

  • Санкт-Петербург

  • до 200000 RUR

ГК Тихие Крылья
  • Санкт-Петербург

  • до 200000 RUR

Датаджайл

C++ разработчик

Датаджайл

  • Санкт-Петербург

  • до 200000 RUR

Haulmont
  • Санкт-Петербург

  • до 250000 RUR

Тракт
  • Санкт-Петербург

  • до 250000 RUR

РТК Радиология

Программист C++/Qt

РТК Радиология

  • Санкт-Петербург

  • до 250000 RUR

Электромобили Мануфэкчуринг Рус

Программист микроконтроллеров

Электромобили Мануфэкчуринг Рус

  • Санкт-Петербург

  • до 250000 RUR

АО ЗАСЛОН
  • Санкт-Петербург

  • до 250000 RUR

  • Санкт-Петербург

  • до 350000 RUR

Авиационная и Морская Электроника, Научно-производственное предприятие

Ведущий инженер-программист

Авиационная и Морская Электроника, Научно-производственное предприятие

  • Санкт-Петербург

  • до 350000 RUR

BLACKHUB GAMES
  • Санкт-Петербург

  • до 350000 RUR

РэилМатик
  • Санкт-Петербург

  • до 350000 RUR

Радар ММС
  • Санкт-Петербург

  • до 350000 RUR

НеоБИТ
  • Санкт-Петербург

  • до 350000 RUR

Холдинг ЛЕНПОЛИГРАФМАШ
  • Санкт-Петербург

  • до 150000 RUR

Лазерные Системы

Инженер-программист С++

Лазерные Системы

  • Санкт-Петербург

  • до 300000 RUR

efin
  • Санкт-Петербург

  • до 300000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию