Привет! ВкусВилл развивает внутренние ИИ-сервисы: поиск по базе знаний (RAG), умные ассистенты для сотрудников, транскрибатор и саммаризатор встреч, внутренние агенты. Ищем ML-инженера с пониманием бэкенда, который умеет не только в модели, но и в код сервисов: API, хранение данных, интеграции.
Чем предстоит заниматься:
Разрабатывать и дорабатывать ML/LLM-решения для наших продуктов:
RAG-поиск, внутренние ассистенты, транскрибатор и саммаризатор встреч.
Делать прототипы моделей и доводить их до продакшена: от экспериментов до стабильного сервиса.
Понимать бэкенд-часть: работа с API на Python, работа с БД, интеграции с внутренними системами.
Настраивать и улучшать промпты, пайплайны LangChain/LangGraph и т.п., работать с векторным поиском.
Следить за качеством: метрики моделей, логирование, разбор инцидентов.
Стек и технологии:
Python (основной язык), промышленная разработка от 3 лет.
ML / LLM:
1. PyTorch, Transformers, классический ML (линейные модели, бустинги).Оркестрация и RAG: LangChain / LangGraph или аналоги.
Данные и хранение: SQL-БД, векторные БД (Qdrant / pgvector / др.).
Бэкенд: FastAPI, написание и поддержка REST-/gRPC-сервисов.
Инфраструктура: Docker, Git, базовое понимание CI/CD, мониторинг и логирование.
Наш кандидат:
Опыт работы ML-инженером / backend+ML в кросс-функциональных командах от 3 лет
Умение решать задачи от подготовки данных и выбора модели до рабочего сервиса в проде.
Опыт разработки на Python.
Понимание, как устроен веб-сервис: запрос–обработка–БД–ответ, базовая оптимизация по времени ответа.
Опыт работы с текстовыми задачами (NLP): классификация, ранжирование, генерация или вопрос–ответ.
Будет плюсом:
Опыт в проектах с RAG, внутренними ассистентами, чат-ботами.
Опыт настройки пайплайнов для разметки данных и улучшения качества LLM-ответов.
Базовый опыт MLOps: деплой моделей, мониторинг качества, переобучение.
Умение работать с Airflow.
Условия: