Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph.
Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных (Qdrant — наш основной стек).
Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде.
Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантнности ответов.
MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности.
Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании.
Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI.
Требования:
Уверенное владение Python и опыт коммерческой разработки от 3 лет.
Практический опыт работы с фреймворками LangChain и LangGraph.
Опыт работы с векторными базами данных, в первую очередь с Qdrant.
Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering.
Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio).
Опыт файн-тюнинга (fine-tuning) open-source LLM.
Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач.
Будет большим плюсом:
Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL).
Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM).
Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами.
Понимание классических алгоритмов и структур данных.
Вклад в open-source проекты.
Условия:
Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи.
Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально).
Сильную команду инженеров, увлеченных своим делом.
Гибкий график и возможность работать удаленно из любой точки мира.