Data Scientist в проект GigaChat

Data Scientist в проект GigaChat

Москва, Кутузовский проспект, 32к1

Метро: Кутузовская

Показать контакты

Описание вакансии

Мы ищем Data Scientist для работы над данными pretrain языковых моделей типа ChatGPT Куда: прод команда больших языковых моделей в SberDevices

Задачи:

майнить данные: писать и запускать код для сбора данных с разных платформ (где есть много данных, которых нет в Common Crawl)
собирать параллельные корпусы текста для машинного перевода
очищать данные: обрабатывать сырые данные из интернета, выкидывать рекламные блоки, непонятные блоки, использовать существующие или обучать новые языковые модели для решения подобных задач
убирать дубликаты: оптимизировать объем данных для экономии ресурсов на обучение, удалять дубли и схожий контент, использовать существующие или обучать новые языковые модели для решения подобных задач

Требования:

диплом ШАДа с заветными тремя словами: Natural language processing

Условия:

масштабные, сложные и разнообразные задачи, находящиеся на острие инноваций
сильная команда отзывчивых профи и гуру, которые всегда помогут
текущий объем датасета 4Тб текста, будет намного больше
фидбек и возможность увидеть результаты своей работы в продукте
своя digital-платформа для развития ключевых IT-компетенций, внутренние и внешние конференции и проф. сообщества Сбера
много корпоративных плюшек
расширенная программа ДМС (возможность подключения родственников), страхование жизни
специальные условия по кредитам/ипотеке, скидки от компаний-партнёров
знаменитый офис на Кутузовском проспекте с парковкой, спортзалом, массажными креслами и возможностью выбора формата работы (офис или гибрид)
атмосфера стартапа и надёжность гиганта.

Посмотреть контакты работодателя

Адрес

Зарплата
Не указана
Занятость
Полная занятость, Полный день
Опыт работы
От 3 до 6 лет
Дата размещения:
14.05.2024 04:11:48

Похожие вакансии

Data Scientist (предиктивные модели)

Газпромбанк

Полный день

Москва
Не указана

Рекомендуем

Middle Data Scientist

МегаФон

Полный день

Москва
Не указана

Рекомендуем

Data Scientist (Аналитик данных)

Московский Кредитный Банк

Полный день

Москва
Не указана

Рекомендуем

Middle Data Scientist (команда перспективных алгоритмов машинного обучения)

Банк ВТБ (ПАО)

Полный день

Москва
Не указана

Data scientist

СБЕР

Полный день

Москва
Не указана

Middle Data Scientist в стрим моделирования КИБ и СМБ (NLP\классический ML\графовые сети)

Банк ВТБ (ПАО)

Полный день

Москва
Не указана

Data Scientist (Junior/Middle)

ARK

Полный день

Москва
Не указана

Data Scientist

ЛУКОЙЛ

Полный день

Москва
Не указана

Data Scientist

Т1

Удаленная работа

Москва
Не указана

Middle/Senior Data Scientist в Модерацию контента

WILDBERRIES

Полный день

Москва
Не указана

Data scientist

Эр-1

Полный день

Москва
Не указана

Data scientist (клиентская аналитика и моделирование розничного бизнеса)

БАНК УРАЛСИБ

Полный день

Москва
Не указана

Middle Data Scientist

Аналитический центр при Правительстве Российской Федерации

Полный день

Москва
Не указана

Data Scientist

Бэнкс Софт Системс

Полный день

Москва
Не указана

Data Scientist (Специалист по обработке и анализу данных)

Ventra IT Solutions

Гибкий график

Москва
до 200000 RUR

Senior Data Scientist

Цифровые технологии и платформы

Полный день

Москва
до 200000 RUR

Data Scientist

Ростелеком

Удаленная работа

Москва
до 200000 RUR

Senior Data Scientist (NLP)

Цифровые технологии и платформы

Полный день

Москва
до 200000 RUR

Data Scientist NLP (портал gosuslugi.ru)

РТЛабс

Полный день

Москва
до 200000 RUR

Data Scientist, Ранжирование поиска

Ozon

Удаленная работа

Москва
до 200000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.

Оставить вакансию