Проектирование и развитие архитектуры AI/ML решений внутри Data Lake House (Spark, Airflow, S3, GreenPlum, ClickHouse).
Курирование разработки ML-моделей и экспериментов: от прогнозных моделей (спрос, динамическое ценообразование) до рекомендательных систем.
Разработка стратегии использования LLM (Large Language Models) и их интеграция в бизнес-процессы (чат-боты, автоматическая обработка текстов, генерация контента).
Дизайн инфраструктуры для обучения, тестирования и инференса моделей (ML Ops, CI/CD пайплайны).
Выстраивание пайплайнов данных и feature stores совместно с Data Engineering командой.
Участие в построении стратегии AI/ML и roadmap развития технологического стека.
Аудит качества данных, выбор архитектурных паттернов, стандартизация подходов к разработке моделей.
Наставничество команды ML и DS: код-ревью, архитектурные решения, планирование экспериментов.
Взаимодействие с бизнес-подразделениями по приоритизации задач и оценке эффекта от внедрения ML/LLM.
Требования:
Опыт работы в роли ML архитектора или ML тех-лида — от 3 лет.
Глубокие знания Python, ML- и DL-стека (scikit-learn, PyTorch, TensorFlow, XGBoost, LightGBM).
Опыт проектирования и внедрения LLM решений (Transformers, LLaMA, RAG, OpenAI API и др.).
Знание архитектуры Data Lake / Data Lake House, опыт работы с Spark, Airflow, объектными хранилищами (S3), колоночными СУБД (GreenPlum, ClickHouse).
Опыт построения ML Ops: CI/CD пайплайны, автоматизация деплоя моделей, мониторинг и откаты.
Навыки проектирования feature stores и организации подготовки данных для моделей.
Опыт интеграции ML/LLM решений в бизнес-процессы (e-commerce, ритейл, финтех и др.).
Опыт взаимодействия с Data Engineers и BI-аналитиками.
Навыки управления командой и проведения архитектурных ревью.
Будет плюсом:
Опыт миграции AI/ML пайплайнов на облачные или гибридные архитектуры.
Знание подходов к оптимизации LLM (quantization, distillation).
Опыт работы с real-time inference и online learning.
Понимание требований к GDPR/ФЗ-152 и принципов data privacy при работе с ML/AI.