Москва
Метро: Библиотека им.ЛенинаООО "RostJob" — ведущая аутсорсинговая IT-компания, предоставляющая высококлассные решения для клиентов по всему миру. Мы специализируемся на разработке масштабных корпоративных приложений, веб-сервисов и мобильных решений, обеспечивая нашим партнерам надежность и инновационные технологии.
Важно:
Резюме должно отражать:
Обязательные требования:
Опыт вывода LLM-решений в прод;
Уверенное владение Python и асинхронным программированием (asyncio);
Уверенное владение Kubernetes (Helm, управление кластерами);
Знание Gitlab CI, Jenkins и пр.;
Понимание архитектуры RAG-систем, работы embedding-моделей и ранжирования;
Умение оптимизировать инференс: квантизация, continuous batching, PagedAttention.
Задачи на проекте:
Проектирование и развитие self-service CI/CD пайплайнов для бесшовного деплоя AI-агентов и мультиагентных систем;
Развертывание и оптимизация LLM/VLM в продакшене (оптимизация памяти, скорость генерации);
Обеспечение высокой доступности сервисов, работа с масштабированием горизонтальных подов и управление состоянием агентов;
Внедрение комплексного observability: от стандартных метрик (CPU/GPU, latency) до специфичных ML-метрик (качество генерации, дрейф данных, оценка тональности ответов).
Мы предлагаем:
Если вы готовы присоединиться к нашей команде и развиваться вместе с ООО "РостДжоб", отправляйте свое резюме.
Ждем вас!