Data Scientist

ГУП Московский социальный регистр

Data Scientist

Москва, Яковоапостольский переулок, 12с1

Метро: Курская

Описание вакансии

Департамент информационных технологий Москвы создает и развивает цифровые проекты, которые делают столицу комфортнее, а жизнь горожан — удобнее и мобильнее. Для системы управления столицей технологии — это незаменимый инструмент, который применяется во всех отраслях экономики, городского хозяйства и социальной сферы. А для миллионов горожан — повседневный помощник, который позволяет получать сотни услуг и сервисов в удобном цифровом формате в режиме 24/7.

Лаборатория ИИ — небольшая команда ДИТ г. Москвы, создающая пилотные решения на базе искусственного интеллекта для городских сервисов. Мы разрабатываем прототипы в областях компьютерного зрения и обработки естественного языка, быстро проверяя гипотезы и внедряя решения в реальных условиях мегаполиса.

В команду требуется Data Scientist уровня Middle, который специализируется на компьютерном зрении (CV) или обработке текста (NLP). Вы будете заниматься разработкой моделей для прототипов новых сервисов города.

Что нужно делать:

Если ваш фокус — компьютерное зрение:

  • Разработка и обучение моделей для задач object detection, semantic segmentation, OCR, трекинга объектов;
  • Работа с изображениями и видео: предобработка данных, аугментации, подготовка датасетов;
  • Подбор и кастомизация архитектур (YOLO, Faster R-CNN, RetinaNet, UNet, ViT и др.);
  • Оценка качества моделей (IoU, mAP и др.);
  • Работа с инструментами аннотации данных (CVAT, Supervisely, Label Studio);
  • Участие в создании пайплайнов инференса и оптимизации моделей для реального применения.

Если ваш фокус — обработка естественного языка:

  • Разработка NLP-решений: классификация текстов, извлечение сущностей (NER), определение тональности, тематическое моделирование;
  • Построение систем семантического поиска и сопоставления текстов;
  • Обучение и дообучение моделей на базе трансформеров (BERT, RoBERTa, GPT и др.);
  • Работа с пайплайнами подготовки текстовых данных;
  • Настройка и оценка качества моделей (Precision, Recall, F1, BLEU и др.);
  • Разработка прототипов чат-ботов и интеллектуальных агентов.

Наш технологический стек:

Язык программирования: Python

Computer Vision:

  • PyTorch, Detectron2, MMDetection, YOLO (v5, v7, v8);
  • OpenCV, Albumentations;
  • torchvision, timm.

NLP:

  • HuggingFace Transformers (BERT, RoBERTa, DistilBERT, GPT);
  • spaCy, NLTK, Sentence Transformers.

Обработка данных: pandas, numpy, scikit-learn.

Инструменты аннотации: CVAT, Supervisely, Label Studio.

Инфраструктура и MLOps: MLflow, DVC, Docker, Git.

Рабочая среда: Linux, JupyterLab, VSCode.

Какие знания и навыки нам важны:

  • Опыт в области Data Science от 2 лет в одной из областей: Computer Vision или NLP;
  • Глубокие знания Python и библиотек для работы с данными и моделями;
  • Умение подбирать и адаптировать архитектуры под задачи;
  • Навыки подготовки данных для обучения и оценки моделей;
  • Умение быстро разрабатывать прототипы и проверять гипотезы;
  • Способность работать в маленькой, динамичной команде.

Будет плюсом:

  • Опыт оптимизации моделей для продакшн-систем: квантизация, дистилляция, pruning;
  • Навыки профилирования и ускорения инференса моделей (ONNX, TensorRT);
  • Опыт в обработке видео (для CV) или генерации текстов (для NLP);
  • Участие в соревнованиях Kaggle или аналогичных платформах;
  • Навыки работы с большими вычислительными ресурсами (GPU, распределённое обучение).

Что предлагаем:

  • Участие в создании реальных пилотных AI-решений для города Москвы;
  • Возможность заниматься исключительно исследованиями и разработкой без "корпоративной рутины";
  • Небольшая команда, прямая коммуникация и быстрая обратная связь;
  • Оформление по ТК в аккредитованной ИТ компании;
  • Годовое премирование по результатам работы;
  • Возможность поработать с самыми разными технологиями и решениями, применять новое в работе;
  • Участие в социально-полезных проектах;
  • Адаптивная система обучения;
  • Развитая корпоративная культура, мероприятия и приятные бонусы для сотрудников;
  • Офис в бизнес-центре класса А (в пешей доступности от метро Курская);
  • Корпоративное обучение и доступ к онлайн-библиотеке.
Посмотреть контакты работодателя

Адрес

Похожие вакансии

ФГАОУ ВО МГТУ им. Н.Э. Баумана

Data Scientist (NLP/ LLM)

ФГАОУ ВО МГТУ им. Н.Э. Баумана

Полный день
  • Москва

  • Не указана

Рекомендуем
АПТЕКА ВАША № 1

Data Scientist / ML Engineer

АПТЕКА ВАША № 1

Полный день
  • Москва

  • Не указана

Рекомендуем
МТС
Полный день
  • Москва

  • Не указана

Рекомендуем
Aston
Полный день
  • Москва

  • Не указана

СБЕР

Data Scientist

СБЕР

Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

СБЕР
Полный день
  • Москва

  • Не указана

Employcity

Data Scientist

Employcity

Удаленная работа
  • Москва

  • Не указана

Сеть розничных магазинов Добрынинский. Кондитерская и гастрономия.

Junior Data Scientist / ML-инженер

Сеть розничных магазинов Добрынинский. Кондитерская и гастрономия.

Полный день
  • Москва

  • до 80000 RUR

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • до 80000 RUR

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Middle Data Scientist

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • до 80000 RUR

Data Scientist

МКК Луна

Удаленная работа
  • Москва

  • до 80000 RUR

А ДЕНЬГИ

Data Scientist (Риски)

А ДЕНЬГИ

Удаленная работа
  • Москва

  • до 80000 RUR

Скала^р

Data Science

Скала^р

Полный день
  • Москва

  • до 80000 RUR

СБЕРКОРУС

Data Scientist LLM (GMMC)

СБЕРКОРУС

Полный день
  • Москва

  • до 80000 RUR

СБЕР
Полный день
  • Москва

  • до 80000 RUR

СБЕР
Полный день
  • Москва

  • до 80000 RUR

СБЕР
Полный день
  • Москва

  • до 80000 RUR

СБЕР
Полный день
  • Москва

  • до 80000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию