Мы создаем передовые системы Computer Use Agents (CUA) — ИИ-агентов, которые взаимодействуют с интерфейсами так же, как человек. В нашем стеке новейшие Vision-Language модели (UI-TARS, GUI-OWL), сложная оркестрация и амбициозные задачи по автоматизации цифрового мира.
Если вы следите за последними SOTA-релизами в области VLM и хотите внедрять их в реальный продакшн — мы ждем вас.
Чем предстоит заниматься
Развитие CUA-агентов: Повышение accuracy прохождения сценариев, оптимизация цепочек действий и обработка сложных edge-кейсов (динамический контент, капчи).
Проектирование архитектуры: Внедрение Multi-agent и Judge-based подходов для контроля качества работы агентов.
Работа с VLM: Подбор, Prompt Engineering и Fine-tuning моделей (UI-TARS, Claude Vision, GUI-Owl).
Оптимизация инференса: Деплой моделей через vLLM, работа с Tensor Parallelism и батчингом для высоконагруженных систем.
Масштабирование: Управление парком виртуальных машин через Docker API и параллелизация агентных задач.
Наш технологический стек
Backend: Python (Asyncio), FastAPI, SQLAlchemy, Alembic, PostgreSQL (asyncpg).
AI/ML Core: GPT-5-mini, Claude (Computer Use API), vLLM, UI-TARS, GUI-OWL.
Агенты: Собственные CUA-пайплайны, UI-TARS agent loop.
Инфраструктура: Docker & Docker Compose, S3 (логи/скриншоты), VNC-управление, Docker API.
Что мы ожидаем от вас
Опыт с LLM в Production: Глубокое понимание Prompt Engineering, Function Calling, Structured Output и CoT.
Агентский опыт: Практика построения систем на базе LangGraph, ReAct или аналогичных фреймворков.
CUA Expertise: Понимание принципов работы GUI-агентов (Anthropic Computer Use или аналоги).
Strong Python: Уверенное владение асинхронным стеком (FastAPI, asyncio).
DevOps-культура: Опыт работы с Docker на уровне уверенного пользователя.
Research mindset: Умение читать актуальные статьи (ArXiv), разбирать Open-source репозитории и внедрять бенчмарки.
Будет преимуществом:
Опыт Fine-tuning vision-моделей.
Практика работы с vLLM / TGI и оптимизацией весов.
Знакомство с инструментами веб-автоматизации (Playwright, Selenium) для понимания контекста задач.
Что мы предлагаем
Сильная команда: Возможность профессионального роста среди экспертов в области Agentic AI.
Гибкость: Полностью удаленный формат работы или офис (по желанию).
Официальное трудоустройство.
Ресурсы: Доступ к необходимым мощностям для обучения и инференса моделей.