Проектирование общей архитектуры мультиагентной системы сбора и анализа мультимодальных данных;
Техническое руководство командой (2 Middle, 4 Junior), распределение задач и контроль качества;
Выбор моделей: мультимодальная LLM для анализа, модели для эмбеддингов (CLIP/DINOv2 для изображений, VideoCLIP для видео, Whisper для аудио);
Проектирование стратегии ReAct / Plan-and-Execute для сложных аналитических цепочек;
Проектирование унифицированной схемы данных и БД (PostgreSQL + PostGIS + FAISS/Milvus);
Внедрение системы трейсинга и observability для всех агентов системы (LangSmith / OpenTelemetry / кастомное решение);
Проектирование методологии A/B-тестирования промптов и моделей, постановка экспериментов по оптимизации архитектуры агентов;
Разработка стратегии управления памятью агентов (эпизодическая, семантическая, процедурная) и оптимизации контекстного окна;
Внедрение системы автоматического тестирования агентов (юнит-тесты на инструменты, интеграционные тесты цепочек, оценка качества ответов);
Настройка мониторинга и алертинга при деградации качества или аномалиях в работе агентов;
Развитие технических компетенций команды, проведение внутренних обучений.
Требования:
Языки программирования: Python (экспертный уровень: асинхронная обработка, проектирование сложных абстракций, оптимизация производительности);
Мультиагентные архитектуры: экспертиза в проектировании систем с агентами на основе ReAct, Plan-and-Execute; опыт с LangGraph, CrewAI, AutoGen; понимание организации обмена сообщениями, управления памятью и состоянием распределённой агентной системы;
Мультимодальные LLM: опыт работы с моделями, понимающими текст + изображение + видео + аудио (GPT-4V, LLaVA, Qwen-VL, Video-LLaMA, Whisper для аудио); понимание архитектуры VLM (Vision-Language Models);
Оркестрация агентов: проектирование потоков выполнения (DAG), обработка отказов агентов, восстановление, параллельное выполнение;
Векторные БД и RAG: опыт построения retrieval-augmented систем для мультимодальных данных (текст, изображения, видео), работа с FAISS/Milvus/Qdrant, мультимодальные эмбеддинги (CLIP, DINOv2, VideoCLIP);
Дедупликация мультимодальных данных: алгоритмы поиска дубликатов новостей (похожесть текста + близость визуальных признаков + время + гео);
Интеграция с источниками: понимание архитектуры коннекторов к Telegram, RSS, Web (парсинг), API новостных агрегаторов;
LLMOps / AgentOps: понимание жизненного цикла LLM-агентов в production, опыт внедрения трейсинга (LangSmith, OpenTelemetry, Phoenix Arize), мониторинга метрик (точность, latency, стоимость токенов);
Экспериментирование: опыт постановки A/B-тестов для сравнения промптов, моделей и архитектур агентов; работа с инструментами трекинга экспериментов (MLflow, Weights & Biases, DVC);
Оптимизация агентов: стратегии управления контекстным окном, кэширование вызовов LLM, выбор оптимальной модели под задачу (баланс качество/скорость/стоимость);
Тестирование агентов: методология оценки качества (LLM-as-judge, human-in-the-loop), проектирование тестовых наборов для недетерминированных систем.
Условия:
Конкурентный уровень з/п (обсуждается индивидуально);
Дневная рабочая неделя 5/2 (ненормированная);
Работа в крупной и стабильной компании – в структуре самой большой ОЭЗ в Европе;
Транспорт до работы из г. Елабуга, г. Набережные Челны, г. Нижнекамск;
Полис добровольного медицинского страхования;
Предоставление платного жилья для иногородних;
Гарантия профессионального роста;
Амбициозная, проектно-ориентированная команда;
Командные и спортивные игры, реализация нестандартных задач;
Карьерный рост при наличии и обретении в процессе работы необходимых компетенций.