Проектирование архитектуры конвейеров обработки данных (извлечение, трансформация, загрузка);
Проектирование и оптимизация архитектуры работы с графовыми и векторными хранилищам для операций анализа объектов и связей;
Проектирование и разработка инфраструктуры MCP для взаимодействия ИИ-агентов с инструментами;
Проектирование и разработка инструментов (MCP-tools) для ИИ-агентов;
Координация интеграции модулей обработки (верификации, очистки, нормализации и т.д.), извлечения сущностей и связывания сущностей (заполнение онтологий), в единый конвейер;
Обеспечение производительности обработки (≤5 мин на 1 млн записей) и отказоустойчивости конвейеров;
Настройка мониторинга состояния конвейеров и выявление узких мест.
Что для нас важно:
Опыт коммерческой разработки на Python/Java не менее 5 лет;
Глубокое знание паттернов проектирования конвейеров обработки данных (ETL/ELT);
Опыт работы с графовыми БД и построения графов знаний;
Умение проектировать архитектуру сервисов для обработки больших объёмов данных;
Опыт разработки систем верификации и связывания сущностей (Entity Resolution);
Знание подходов к обеспечению производительности при работе с миллионами записей;
Понимание принципов работы MCP или аналогичных инфраструктур для ИИ-агентов.
Будет плюсом:
Опыт работы с векторными БД (Weaviate, Qdrant и т.д.);
Знание фреймворков для оркестрации ИИ-агентов (LangChain, LangGraph);
Опыт разработки систем семантического поиска и обогащения данных;
Понимание онтологий и семантических технологий (RDF, OWL, SPARQL).