Москва
Метро: Библиотека им.ЛенинаAI / LLM Engineer
О проекте
Ищем AI / LLM Engineer в команду, которая развивает AI-продукты и внедряет большие языковые модели в production-сервисы. Основной фокус — создание надёжных решений на базе LLM: от прототипирования до масштабируемых систем с контролем качества, latency и стоимости. Важно уметь превращать LLM-функциональность в стабильные продуктовые сервисы.
Задачи
• Проектировать и развивать LLM-based сервисы (RAG, AI-ассистенты, генеративные фичи);
• Интегрировать LLM API и open-source модели в backend-системы;
• Разрабатывать RAG-пайплайны: ingestion, embeddings, retrieval, reranking;
• Работать с vector DB (индексация, поиск, оптимизация);
• Развивать prompt management и evaluation (качество ответов);
• Оптимизировать latency и стоимость inference;
• Обеспечивать надёжность и безопасность (guardrails, fallback-стратегии);
• Настраивать мониторинг, логирование и поддержку сервисов;
• Взаимодействовать с продуктовой и ML-командой.
Требования
Обязательно:
• Коммерческий опыт разработки от 3 лет (backend / ML / AI);
• Сильный Python;
• Опыт работы с LLM (API или open-source модели);
• Понимание RAG (retrieval, embeddings, chunking);
• Опыт работы с vector DB;
• Понимание prompt engineering;
• Понимание trade-offs: latency / cost / quality;
• Опыт промышленной разработки (Git, код-ревью, тестирование).
Будет плюсом:
• Опыт с open-source LLM (LLaMA, Mistral и др.);
• Fine-tuning моделей;
• Опыт с NLP / ML;
• Фреймворки: LangChain, LlamaIndex и др.;
• Observability и evaluation инструментов (LangSmith и др.);
• Docker / Kubernetes;
• Облачные платформы (AWS / GCP / Azure).
Этапы:
• Скрининг (30 минут);
• Техническое интервью (1 час 30 минут).
Условия:
• Работа в динамичной и инновационной IT-компании;
• Возможности для профессионального роста в AI-направлении;
• Дружный и поддерживающий коллектив;
• Конкурентоспособная заработная плата;
• Гибкий график и возможность удалённой работы;
• Интересные задачи на стыке AI, backend и ML.
⸻⸻⸻⸻⸻⸻
Пожалуйста, прикрепите к отклику скрининг по требованиям: отметьте плюсы напротив навыков, которыми вы владеете, и минусы – напротив тех, которых у вас нет. Это поможет улучшить и ускорить рассмотрение отклика.
Например:
• Коммерческий опыт разработки от 3 лет (backend / ML / AI);+
• Сильный Python;+
• Опыт работы с LLM (API или open-source модели);+ и тд.
Национальная система платежных карт
Москва
до 360000 RUR