Data Scientist LLM (Global markets)

СБЕР

Data Scientist LLM (Global markets)

Описание вакансии

Кто мы?

Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера.

Что мы делаем?

Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления бизнеса: торговые операции с ценными бумагами, деривативами, ликвидностью, на валютном, товарно-сырьевом рынках, структурные продукты.

Мы помогаем внутренним клиентам увеличивать доходность, создаем информационную платформу, проводим анализ финансовых рынков, работаем с разными форматами данных.

Наша команда решает очень широкий спектр DS-задач с применением самых передовых ML/DL алгоритмов и инструментов. В нашей компетенции — разработка, тестирования и вывод в промышленную среду моделей .

Мы ищем талантливого специалиста, который обладает опытом работы с большими языковыми моделями (LLM). В этой роли вы будете играть ключевую роль в исследовании и применении нашей LLM для решения широкого спектра задач, включая генерацию текста, извлечение информации, Q&A системы, логическое мышление и другие.

Обязанности

  • Участие в разработке решения на основе обучения/файнтюнинга (SFT LoRA, RLHF) современных генеративных сеток (GigaChat, LLAMA2, Gpt3.5/4);
  • Построение пайплайна обработки данных и обучения LLM (LLM цепочек);
  • Разработка векторизованных баз знаний с использованием LangChain, ChromaDB;
  • Организация процесса мониторинга качества LLM;
  • Тестирование, анализ и ранжирование сильных и слабых сторон различных моделей и конкретного решения;
  • Участие в формировании требований и необходимых данных по улучшению моделей;
  • Оценка как полученное решение достигает поставленных целей;
  • Следить за последними исследованиями и инновациями в области языковых моделей и применять их на практике;
  • Разработка документации и руководства для пользователей и разработчиков;
  • Подготовка и анализ новостей для обучения модели.

Требования

Основные навыки

  • Знание Python на уровне middle-разработчика;
  • Опыт анализа и обработки данных (numpy/pandas) и их визуализация (matplotlib, seaborn, plotly);
  • Опыт web scraping (в идеале – playwright/parsel/httpx, возможно – selenium/beautifulsoup/requests);
  • Опыт работы с БД (ORM);
  • Опыт создания dashboards (streamlit/gradio/dash);
  • Опыт асинхронного программирования (asyncio);
  • Linux;
  • Git;
  • Docker.

Навыки NLP

  • Уверенное владение базовыми знаниями в Deep Learning и NLP с практическим опытом работы в этом направлении;
  • Знание PyTorch или Tensorflow для возможности fine-tuning LLM под конкретную задачу;
  • Знание LLM-фреймворков и библиотек (в идеале – langchain, дополнительно как пример - llama-index, openai) для создания LLM-приложений;
  • Опыт использования LLM (gpt-3.5-turbo/gpt-4/open source), в идеале – опыт использования их API для создания LLM-приложений;
  • Знание методов Prompt Engineering.

Личностные качества

  • Навыки и желание самостоятельного изучения новых технологий для проведения экспериментов и реализации MVP с участием в дальнейшим развитии проектов.

Проекты

  • Наличие публичных проектов, и/или активное участие в разработке open source проектов в области NLP/LLM;
  • Наличие блога по NLP/LLM.

Условия

  • Формат работы: офис (ул.Вавилова,19). Возможен гибрид;
  • ДМС с первого дня;
  • Скидки на продукты банка и экосистемы;
  • Развитая IT архитектура;
  • Постоянное развитие: обучающие курсы от лучших университетов и компаний (МФТИ, ВШЭ, NVIDIA и другие), участие в международных конференциях;
  • Развитое DS community, регулярные митапы, дайджесты и конференции.
Посмотреть контакты работодателя

Похожие вакансии

билайн

Data Scientist

билайн

Полный день
  • Москва

  • Не указана

Рекомендуем

Data Scientist

Вкусно — и точка

Полный день
  • Москва

  • Не указана

Рекомендуем
ОКБ
Полный день
  • Москва

  • Не указана

Рекомендуем
JuicyScore
Полный день
  • Москва

  • от 200000 RUR

билайн
Удаленная работа
  • Москва

  • от 200000 RUR

билайн
Удаленная работа
  • Москва

  • от 200000 RUR

Домклик
Полный день
  • Москва

  • от 200000 RUR

ARK
Полный день
  • Москва

  • от 200000 RUR

VK
Полный день
  • Москва

  • от 200000 RUR

Домклик
Полный день
  • Москва

  • от 200000 RUR

ГК ФСК
Полный день
  • Москва

  • от 200000 RUR

Домклик

Data Scientist (NLP)

Домклик

Полный день
  • Москва

  • от 200000 RUR

VK
Полный день
  • Москва

  • от 200000 RUR

Nexpanse
Удаленная работа
  • Москва

  • от 100000 RUR

AMarkets
Полный день
  • Москва

  • от 100000 RUR

ГИРУС
Гибкий график
  • Москва

  • от 300000 RUR

Gravity Field

Data Scientist

Gravity Field

Полный день
  • Москва

  • от 300000 RUR

ВК ИТС
Полный день
  • Москва

  • от 300000 RUR

Удаленная работа
  • Москва

  • от 250000 RUR

Домклик
Удаленная работа
  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию