IT2G — аккредитованная IT‑компания, реализующая комплексные ИТ‑проекты для государственных структур и крупных корпоративных клиентов. Для развития аналитической платформы одного из крупных банков РФ мы ищем NLP Data Analyst (RCO) — аналитика данных с фокусом на текстовую аналитику и продукты линейки RCO.
Роль сочетает работу с большими объёмами данных, SQL‑аналитикой и задачами NLP: извлечение фактов из текстов, кластеризация новостей/документов, анализ тональности и семантический поиск на базе продуктов RCO и их интеграций с корпоративным порталом и базой знаний.
Задачи
-
Анализ требований бизнеса/заказчика и формулировка задач для развития моделей и правил на базе RCO (Fact Extraction, Sentiment, Clustering, Categorization).
-
Настройка и развитие решений линейки RCO:
-
RCO Fact Extractor — извлечение фактов, сущностей, событий из неструктурированных текстов.
-
RCO Zoom — семантический поиск и интеллектуальная навигация по документам и базам знаний.
-
News Clustering Engine, Sentiment Detection, Text Categorization Engine — кластеризация и категоризация текстов, анализ тональности.
-
Разработка и оптимизация SQL‑запросов (PostgreSQL / Oracle / MS SQL и т.п.): витрины, аналитические выборки, сложные отчёты.
-
Подготовка и очистка данных, контроль качества (data cleaning, нормализация, дедупликация).
-
Оценка качества моделей/правил (метрики, контрольные выборки, сравнение конфигураций).
-
Участие в интеграции RCO‑решений с корпоративным порталом, DWH, базой знаний и другими системами банка совместно с разработчиками и архитекторами.
-
Подготовка технических описаний витрин, полей, логики правил и конфигураций RCO, участие в проектной документации.
Данные и SQL
-
SQL: сложные запросы с множественными JOIN, оконными функциями, CTE, подзапросами и аналитическими функциями.
-
Опыт работы с большими наборами данных (миллионы строк) и оптимизацией запросов.
-
Плюс: Python для аналитики (pandas, базовый ETL, скрипты для проверки качества данных).
NLP / RCO / текстовая аналитика
-
Опыт или интерес к задачам: извлечение сущностей/фактов, семантический поиск, кластеризация текстов, анализ тональности.
-
Прямой опыт с RCO (Zoom, Fact Extractor, News Clustering Engine, Sentiment Detection и др.) — большой плюс.
-
Как релевантный опыт подойдут и другие Text Mining / NLP‑решения (Naumen, PROMT Analyzer SDK, собственные NLP‑пайплайны и т.п.).
BI и документация
-
Excel / Google Sheets: сводные таблицы, продвинутые формулы, подготовка отчётности.
-
BI‑инструменты (Power BI, Tableau, Qlik и аналоги) будут плюсом.
-
Confluence / Wiki — ведение описаний витрин, полей и логики.
-
Jira / Redmine / YouTrack — управление задачами.
Обязательные
-
Опыт аналитиком данных / BI‑аналитиком / системным аналитиком от 6 лет.
-
Уверенный SQL и опыт работы с крупными наборами данных.
-
Базовый или практический опыт в задачах текстовой аналитики / NLP (даже без RCO) либо сильный интерес и готовность быстро в них въехать.
-
Уверенный Excel.
-
Грамотная письменная и устная речь, умение понятно доносить результаты до бизнеса.
Желательные
-
Опыт с RCO или аналогами Text Mining / NLP.
-
Опыт в банковской/финансовой сфере.
-
Python для аналитики, опыт взаимодействия с ML/DS‑командами.
Условия
-
Проект для крупного банка РФ, реальные большие данные и сложная предметная область.
-
Преимущественно удалённый формат работы; возможны выезды к заказчику в начале.
-
Оформление по ТК РФ с 1‑го рабочего дня, «белая» заработная плата.
-
Уровень дохода обсуждается индивидуально, ориентир — комфорт кандидата «на руки».
-
ДМС после испытательного срока, рабочая техника.
-
Профессиональная команда, рост в сторону senior NLP Data Analyst / архитектора данных / RCO‑эксперта.