Наш продукт-универсальное кроссплатформенное приложение, объединяющее в одной экосистеме передовые AI-сервисы для бизнеса и людей.
Мы ищем опытного и мотивированного AI- Engineer, который присоединится к нашей команде .Вы будете ключевым игроком в обеспечении стабильности и производительности нашей платформы, автоматизируя процессы, оптимизируя инфраструктуру и внедряя лучшие практики.
Резидент инновационного центра "Сколково".
Аккредитованная в Минцифры РФ IT компания.
Обязанности:
- Проектирование и разработка AI-агентов: Создание многошаговых логических цепочек (chains) и графов (graphs) для решения комплексных задач с использованием LangChain и LangGraph.
- Создание и оптимизация RAG-систем: Построение пайплайнов для индексации, поиска и дополнения контекста для LLM. Работа с векторными базами данных (Qdrant — наш основной стек).
- Работа с LLM: Деплой, оптимизация и поддержка open-source моделей (Llama, Mistral, Mixtral и др.) для инференса в production-среде.
- Файн-тюнинг моделей: Адаптация и дообучение существующих моделей под специфические задачи и домены нашей компании для повышения качества и релевантности ответов.
- MLOps и инфраструктура: Разработка и поддержка MLOps-пайплайнов для развертывания и мониторинга моделей, обеспечение их стабильности и производительности.
- Интеграция и API: Создание API для интеграции разработанных AI-сервисов в основную платформу компании.
- Исследование и прототипирование: Постоянный поиск и тестирование новых подходов, фреймворков и моделей в области Generative AI.
Требования: - Уверенное владение Python и опыт коммерческой разработки от 3 лет.
- Практический опыт работы с фреймворками LangChain и LangGraph.
- Опыт работы с векторными базами данных, в первую очередь с Qdrant.
- Глубокое понимание принципов работы LLM, RAG, трансформерных архитектур и техник prompt engineering.
- Опыт деплоя ML-моделей в production (Docker, Kubernetes, FastAPI/Gradio).
- Опыт файн-тюнинга (fine-tuning) open-source LLM.
- Аналитический склад ума и умение находить элегантные инженерные решения для сложных продуктовых задач.
-
Будет большим плюсом:
- Опыт работы с экосистемой Hugging Face (Transformers, PEFT, TRL).
- Опыт использования инструментов для оптимизации инференса (vLLM, TensorRT-LLM).
- Опыт работы с облачными платформами (AWS, GCP, Azure) и их AI/ML сервисами.
- Понимание классических алгоритмов и структур данных.
- Вклад в open-source проекты.
Условия: - Работу на переднем крае технологий Generative AI, возможность реализовать самые смелые идеи.
- Конкурентную заработную плату и систему бонусов ( обсуждаем индивидуально).
- Сильную команду инженеров, увлеченных своим делом.
- Гибкий график и возможность работать удаленно из любой точки мира.