Data Scientist LLM (Global markets)

СБЕР

Data Scientist LLM (Global markets)

Описание вакансии

Кто мы?

Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.

Что мы делаем?

Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.

Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.

Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .

Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.

Обязанности

  • Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4);
  • Построение пайплайна обработки данных и обучения LLM (LLM цепочек);
  • Разработка векторизованных баз знаний с использованием LangChain, ChromaDB;
  • Организация процесса мониторинга качества LLM;
  • Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения;
  • Участие в формировании требований и необходимых данных по улучшению моделей;
  • Оценка как полученное решение достигает поставленных целей;
  • Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике;
  • Разработка документации и руководства для пользователей и разработчиков;
  • Подготовка и анализ новостей для обучения модели.

Требования

Основные навыки

  • Знание Python на уровне middle-разработчика;
  • Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly);
  • Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests);
  • Опыт работы с БД (ORM);
  • Опыт создания dashboards (streamlit/gradio/dash);
  • Опыт асинхронного программирования (asyncio);
  • Linux;
  • Git;
  • Docker.

Навыки NLP

  • Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении;
  • Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу;
  • Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений;
  • Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений;
  • Знание методов Prompt Engineering.

Личностные качества

  • Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.

Проекты

  • Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM;
  • Наличие блога по NLP/LLM.

Условия

  • Формат работы: офис (ул.Вавилова,19). Возможен гибрид;
  • ДМС с первого дня;
  • Скидки на продукты банка и экосистемы;
  • Развитая IT архитектура;
  • Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;
  • Развитое DS community, регулярные митапы, дайджесты и конференции.
Посмотреть контакты работодателя

Похожие вакансии

АШАН Ритейл Россия

Data Scientist

АШАН Ритейл Россия

Полный день
  • Москва

  • Не указана

Рекомендуем
ARK
Полный день
  • Москва

  • Не указана

Рекомендуем
JuicyScore
Полный день
  • Москва

  • от 200000 RUR

Рекомендуем
ОКБ
Полный день
  • Москва

  • от 200000 RUR

СберЛизинг

Data Scientist

СберЛизинг

Полный день
  • Москва

  • от 200000 RUR

Смартдиалогс
Полный день
  • Москва

  • от 120000 RUR

билайн
Удаленная работа
  • Москва

  • от 120000 RUR

The Skolkovo Institute of Science and Technology

Senior ML/DS Research Engineer/Scientist

The Skolkovo Institute of Science and Technology

Полный день
  • Москва

  • от 120000 RUR

МегаФон

Middle Data Scientist

МегаФон

Полный день
  • Москва

  • от 120000 RUR

билайн
Удаленная работа
  • Москва

  • от 120000 RUR

Удаленная работа
  • Москва

  • от 120000 RUR

билайн
Полный день
  • Москва

  • от 120000 RUR

WILDBERRIES
Полный день
  • Москва

  • от 120000 RUR

Домклик
Полный день
  • Москва

  • от 120000 RUR

МТС
Полный день
  • Москва

  • от 120000 RUR

Ниармедик Ваш Доктор Рядом

Data Scientist

Ниармедик Ваш Доктор Рядом

Полный день
  • Москва

  • от 120000 RUR

Т1
Удаленная работа
  • Москва

  • от 120000 RUR

Домклик
Полный день
  • Москва

  • от 120000 RUR

AMarkets
Полный день
  • Москва

  • от 120000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию