проектировать сквозную архитектуру AI-решений: AI-агентов и LLM-сервисов вместе с RAG, memory, tool calling и orchestration;
встраивать AI в существующий enterprise-ландшафт с учётом текущих систем, стандартов и компонент платформы (ПКАП). выявлять гепы в их функционале и эскалировать запросы на развёртывание;
совместно с Data Scientist и Product Owner выявлять, декомпозировать и документировать архитектурные и интеграционные требования. транслировать бизнес-требования в техническое решение%
выбирать модели (проприетарные — например GigaChat, и open-source LLM), инфраструктуру и стек под конкретные ограничения и задачи; контролировать latency, стоимость inference и стабильность системы;
совместно с корпоративными архитекторами (EA), экспертами кибербезопасности и командой сопровождения выбирать технические компоненты и проектировать интеграции. акцептовать либо аргументированно оспаривать решения Мастер-команды;
самостоятельно собирать PoC и прототипы агентов и интеграций, разрабатывать reference-код и шаблоны для стандартизации и масштабирования. передавать прод-разработку команде;
синхронизировать команды core AI, backend и tools/интеграции. задавать архитектурные стандарты и менторить MLE/DS в нескольких командах кластера.
Требования:
опыт работы от 3-х лет;
архитектурное проектирование и системное мышление: • опыт проектирования сквозных (end-to-end) технических решений, декомпозиции и документирования требований. • способность транслировать бизнес-требования в техническое решение и балансировать ограничения (время, доступные компоненты, latency, стоимость) против стандартов платформы.
архитектура GenAI / LLM-сервисов и AI-агентов: • практический опыт с проприетарными (GigaChat) и open-source LLM; осознанный выбор между prompt engineering, RAG и fine-tune/LoRA под задачу. • контроль эксплуатационных характеристик: latency, стоимость inference, стабильность; observability, eval-пайплайны, guardrails.
архитектура GenAI / LLM-сервисов и AI-агентов: • проектирование LLM-сервисов и агентных систем: RAG (retrieval, чанкинг, векторные хранилища, реранкинг), memory, tool/function calling, оркестрация (в т.ч. multi-agent). • практический опыт с проприетарными (GigaChat) и open-source LLM; осознанный выбор между prompt engineering, RAG и fine-tune/LoRA под задачу. • контроль эксплуатационных характеристик: latency, стоимость inference, стабильность; observability, eval-пайплайны, guardrails.
знание enterprise-ландшафта и работа со стандартами платформы: • Глубокое понимание корпоративной архитектуры и умение встраивать AI с учётом существующих систем.
кросс-командное лидерство и коммуникация (грейд Lead/Principal): • Задание архитектурных стандартов и shared-шаблонов для нескольких команд, менторство MLE/DS. • Стейкхолдер-менеджмент (PO, DS, TL, CL, бизнес-пользователи), сильная аргументация архитектурных решений.
hands-on прототипирование: • Самостоятельная разработка PoC/прототипов агентов и интеграций, reference-кода и шаблонов с последующей передачей команде на продакшнизацию.
Условия:
оформление по ТК РФ с первого дня и все социальные гарантии;
гибридный формат работы;
ДМС после испытательного срока;
страхование жизни сотрудника;
для работы предоставляем ноутбук, наушники, мышь, при необходимости – и другую технику;
доступ к библиотеке IBS, к открытым бесплатным курсам от "Среды развития", к вебинарам "Биржи знаний";
бонусы и бенефиты для наших сотрудников: подарки для детей ко Дню знаний, на Новый Год, скидки у корпоративных партнёров;
подарки для сотрудников, вступающих в брак;
материальная помощь на рождение и усыновление детей;
награда за лояльность к компании и премия за выслугу лет.