Senior Machine Learning Engineer (LLM, RL)

Intella

Senior Machine Learning Engineer (LLM, RL)

Москва, Кольцевая линия, метро Павелецкая

Метро: Павелецкая

Описание вакансии

Мы – Intella, крупнейшее узкопрофильное кадровое агентство на территории СНГ.

Сейчас мы ищем амбициозных кандидатов на роль Senior Machine Learning Engineer для международной компании, специализирующейся на разработке бизнес-решений с применением искусственного интеллекта. Организация работает над проектами, которые напрямую влияют на развитие фармацевтики и медицины. Команда мультиязычная, офисы разработки расположены в нескольких странах, включая Абу-Даби (ОАЭ). В компании работает более 300 сотрудников, а проекты реализуются на глобальном уровне.

Задачи:

  • Разработка и масштабирование тонкой настройки обучения с подкреплением для LLM, включая подходы RLHF, RLVR и другие современные методы

  • Построение и оптимизация высокопроизводительных конвейеров обучения трансформеров в средах с несколькими GPU и несколькими узлами.

  • Разработка экспериментов, мониторинг ключевых метрик и представление результатов в виде презентаций и/или публикаций.

  • Масштабирование пайплайнов и параллелизация обучения

Ожидания от кандидата:

  • ​​​​​​​Коммерческий опыт тренировки и масштабирования LLM моделей: pre-train, fine-tune, обучение на нескольких GPU
  • Коммерческий опыт с RL ( RLHF / RLVR ), знание алгоритмов и методов preference-based optimization (PPO / DPO / RLOO / GRPO),
  • Навыки масштабирования пайплайнов, параллелизации обучения (DeepSpeed, vLLM)
  • Глубокие знания Python, PyTorch, Transformers / Diffusion models
  • Английский уровня B2+ для общения с командой
  • Высшее образование

Будет плюсом бэкграунд генеративными моделями/ разработкой LLM для написания кода / построением ревордных моделей / диффузионными моделями для молекул

​​​​​​​​​​​​​​Мы предлагаем:

  • Участие в социально-значимом медицинском проекте
  • Релокацию в Абу-Даби, ОАЭ. Возможна удаленная работа на период прохождения испытательного срока
  • Медицинскую страховку
  • Гибкий график работы
Навыки
  • Python
  • Data Analysis
  • Машинное обучение
  • Математическая статистика
  • Теория вероятностей
  • Линейная алгебра
  • LLM
  • RL
  • reinforcement learning
  • Rewards
  • data science
  • ds
  • gan
  • RLVR
  • RLHF
  • PPO
  • DPO
  • RLOO
  • GRPO
  • Transformers
  • Diffusion models
  • pre-train
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Технопарк

Data Engineer/ ML Engineer

Технопарк

Удаленная работа
  • Нижний Новгород

  • от 250000 RUR

Рекомендуем
YADRO
Удаленная работа
  • Нижний Новгород

  • от 250000 RUR

Рекомендуем
YADRO
Удаленная работа
  • Нижний Новгород

  • от 250000 RUR

Рекомендуем
Haulmont
Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Бифорком Тек

Team Lead (data plane)

Бифорком Тек

Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Бифорком Тек

QA Automation Engineer(Python)

Бифорком Тек

Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Бифорком Тек
Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Open Media
Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Группа Компаний Аскона

Главный аналитик

Группа Компаний Аскона

Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

YADRO
Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Бифорком Тек
Удаленная работа
  • Нижний Новгород

  • до 80000 RUR

Гаврилович Виталий Юрьевич
Удаленная работа
  • Нижний Новгород

  • до 160000 RUR

Айотекс
Удаленная работа
  • Нижний Новгород

  • до 160000 RUR

АСКОН
Удаленная работа
  • Нижний Новгород

  • до 160000 RUR

RetailCRM
Удаленная работа
  • Нижний Новгород

  • от 130000 RUR

РК-ТЕХНОЛОГИИ
Удаленная работа
  • Нижний Новгород

  • от 130000 RUR

Яндекс Крауд
Удаленная работа
  • Нижний Новгород

  • от 90000 RUR

Медисорб
Удаленная работа
  • Нижний Новгород

  • от 90000 RUR

Группа IT-компаний Lad
Удаленная работа
  • Нижний Новгород

  • от 90000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию