Data Scientist (OCR)

Ингосстрах

Data Scientist (OCR)

Описание вакансии

Мы - Центр развития искусственного интеллекта Ингосстраха. Развиваем продукты в области рисков, customer-relations, компьютерного зрения и обработки естественного языка.

В данный мы делаем сервис, который умеет понимать документы так, как это делает человек: видеть, читать, извлекать смысл, замечать аномалии.

Работаем на реальных кейсах — не модель ради модели, а под конкретные задачи: юридические документы, формы, медицинские заключения, распознавание подделок. Используем всё, что даёт результат — от U-Net и TrOCR до Qwen-VL и мультимодальных LoRA.

У нас нет разделения на "data scientist vs backend" — тот, кто обучает модель, внедряет её сам.

Мы ищем Data Scientist/ML-инженера, который будет разрабатывать и внедрять собственные модели для OCR и интеллектуальной обработки документов. Работа на стыке CV и NLP: классификация, image detection, DocQA, Visual DocQA, извлечение информации из сканов/фотографий или текстовых документов.

Задачи:

  • Разработка моделей для обработки документов: OCR, NER, DocQA, парсинг структуры документа (layout detection);
  • R&D новых подходов, проверка гипотез;
  • Создание моделей распознавания подделок и фотоманипуляций (Image Forgery/Tampering Detection);
  • Создание синтетических данных;
  • Использование и адаптация современных CV и NLP SOTA-моделей;
  • Обработка разнородных документов (сканы, фото, PDF, таблицы, формы), включая структурированные и неструктурированные;
  • Построение end-to-end пайплайна: raw документ → JSON;
  • Внедрение моделей в сервис: пайплайны, API, batch-инференс, ускорение и поддержка.

Требования:

  • Опыт работы от 2х лет по направлению разработки моделей CV и/или NLP;
  • Знание PyTorch, transformers;
  • Умение дообучения моделей;
  • Опыт работы с VLM/LLM;
  • Опыт применения prompt tuning / LoRA / PEFT к VLM/LLM.

Будет плюсом:

  • Опыт разработки OCR-решений;
  • Опыт работы с multiprocessing, multithreading;
  • Опыт работы с: asyncio (FastAPI, FastStream), Pydantic, Gradio/Streamlit, Vault, Redis, kafka, Grafana/Kibana, Docker/Podman + compose.

Стек:

  • Фреймворки: PyTorch, Transformers, peft, vllm;
  • Модели: U-Net, YOLO, Donut, TrOCR, Qwen, Qwen-VL, Mistral;
  • Сервис: asyncio (FastAPI/FastStream), Pydantic, Gradio/Streamlit.

Мы предлагаем:

  • Оформление по ТК РФ, полностью белую заработную плату (оклад + премии);
  • График 5/2, гибкое начало дня (в промежутке с 08:00 до 10:00);
  • Гибридный (г. Москва) или полностью удаленный формат работы (на территории РФ);
  • ДМС после испытательного срока;
  • Подписку Добросервис (неограниченное количество консультаций у высококвалифицированных психологов);

  • Платформу дистанционного обучения IngoStudy (возможность проходить курсы для прокачки soft и hard скиллов) + внешние обучения по согласованию с руководителем;

  • Корпоративную сотовую связь;

  • Льготные страховые продукты (страхование имущества физ.лиц, автотранспорта (Каско), страхование выезжающих за рубеж, страхование ипотеки, страхование от несчастных случаев и болезней);

  • Скидки на обслуживание и ремонт автомобилей;

  • Корпоративные предложения от сети фитнес-клубов: World Class, World Class Lite и UFC GYM;

  • Активную корпоративную жизнь со спортивными секциями: бег, волейбол, йога и др.;

  • Участие в разных благотворительных и экологических акциях, форумах, марафонах;

  • Зарплатный проект от АО Ингосстрах Банка: повышенный кешбэк бонусами, льготы по кредитам, ипотеке, рефинансированию, выгодные ставки по вкладам, накопительным счетам.

Посмотреть контакты работодателя

Похожие вакансии

СберМедИИ

Data Scientist (Middle+/Senior)

СберМедИИ

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
LOYMAX AI
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
SCORISTA
Удаленная работа
  • Москва

  • Не указана

Рекомендуем
STARTRIBE LTD

Senior Data Scientist

STARTRIBE LTD

Удаленная работа
  • Москва

  • Не указана

Ozon
Удаленная работа
  • Москва

  • Не указана

Ozon
Удаленная работа
  • Москва

  • Не указана

Ок Софт

Antifraud data analyst

Ок Софт

Удаленная работа
  • Москва

  • Не указана

Лемана ПРО
Удаленная работа
  • Москва

  • Не указана

Диджитал Лайн

Senior Data Scientist

Диджитал Лайн

Удаленная работа
  • Москва

  • от 200000 RUR

Центр Методического Обеспечения Оптимизации Процессов Государственного Управления в Московской области

Data Scientist (OCR)

Центр Методического Обеспечения Оптимизации Процессов Государственного Управления в Московской области

Удаленная работа
  • Москва

  • от 200000 RUR

М.Видео-Эльдорадо
Удаленная работа
  • Москва

  • от 200000 RUR

Национальная Лотерея

Data Engineer

Национальная Лотерея

Удаленная работа
  • Москва

  • от 200000 RUR

Effective
Удаленная работа
  • Москва

  • до 320000 RUR

GRI
Удаленная работа
  • Москва

  • до 320000 RUR

билайн
Удаленная работа
  • Москва

  • до 320000 RUR

Юрент

Data Engineer

Юрент

Удаленная работа
  • Москва

  • до 320000 RUR

Data Analyst

Финтехник

Удаленная работа
  • Москва

  • до 4000 USD

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию