Москва
Метро: Библиотека им.ЛенинаHR Rocket — технологическая AI / HR Tech платформа, автоматизирующая управление HR-рекламой.
Помогаем крупным компаниям снижать стоимость отклика, оптимизировать бюджеты и делать найм прогнозируемым с помощью ML/AI. Среди наших клиентов — лидеры ритейла, логистики, производства, телеком и других отраслей с массовым подбором.
Кого ищем
Мы ищем LLM‑специалиста, который усилит наш AI‑стек, выстроит архитектуру LLM‑модулей и поможет развивать генеративные продукты внутри HR Rocket.
Чем предстоит заниматься:
Проектировать архитектуру LLM‑модулей и AI‑сервисов внутри платформы;
Разрабатывать и оптимизировать пайплайны: inference, finetuning, RAG, векторные базы;
Строить системы генерации и обработки вакансий, откликов, диалогов, резюме;
Настраивать и улучшать качество LLM‑моделей (evals, safety, data curation);
Встраивать LLM‑функциональность в backend через асинхронные вызовы, очереди и API;
Работать с ML‑модулями, аналитикой и системами прогноза;
Участвовать в разработке AI‑продуктов: автогенерация объявлений, интеллектуальные чат‑боты, умные интерфейсы для рекрутеров;
Оптимизировать стоимость и скорость inference (quantization, batching, caching);
Поддерживать интеграции с внешними LLM‑провайдерами и локальными моделями.
Что от тебя ждем:
5–6+ лет опыта в ML/AI или backend‑разработке;
Опыт работы с LLM: GPT, Claude, Llama, GigaChat, Qwen и др.
Умение проектировать RAG‑архитектуры, опыт со векторными БД (Chroma, Qdrant, Milvus);
Опыт обучения или дообучения моделей (PEFT, LoRA, SFT);
Владение Python (FastAPI);
Глубокое понимание ML‑инфраструктуры, пайплайнов, оптимизации inference;
Опыт работы с Postgres, Redis, очередями, async вызовами;
Знание Docker, Docker Compose; умение работать в CI/CD;
Навыки работы с Git, code review, хорошая инженерная культура;
Опыт работы с Cursor, ClaudeCode или аналогичными инструментами обязателен.
Будет плюсом:
Опыт разработки recommendation systems, ML‑инфраструктуры или data pipelines;
Знание PyTorch, Transformers, vLLM, Llama.cpp, OpenAI‑совместимых API
Навыки DevOps или MLOps.
Что предлагаем:
Возможность строить ключевые AI‑модули первой HR‑маркетинговой платформы в России;
Влияние на архитектуру и продуктовые решения;
Работа в быстрорастущем стартапе с коротким циклом принятия решений;
Современный AI‑стек: LLM, RAG, векторные базы, ML‑интеграции, Python, FastAPI;
Гибкий формат — удалёнка.
Москва
до 650000 RUR
Леусова Екатерина Сергеевна
Москва
от 300000 RUR