Проект: МетаПетс — ИИ-экосистема для ветеринарных клиник (веб для врача, мобайл для владельца, интеграция с МИС).
Фокус роли: обучение и внедрение моделей ИИ в модули ассистента и транскрибации (ASR), построение RAG, работа с LangChain и API крупных провайдеров.
Что будете делать
ASR (речь → текст): подбор/обучение/тонкая настройка русскоязычных моделей, доменная адаптация под ветеринарные термины; оценка качества (WER/CER), пайплайн пост-процессинга и нормализации, сохранение аудио-трэков к визитам.
LLM-ассистент: проектирование промптов и системных сообщений, внедрение RAG (ретривер, индексация, чанкинг, метаданные), построение агентной логики (действия в МИС/поиск по БЗ) на LangChain.
Инфраструктура и интеграции: работа с Elasticsearch (гибридный/векторный поиск), объектным хранилищем, очередями; on-prem/облачные LLM (в т.ч. приватные эндпоинты), конфигурация ограничений и фолбэков.
Качество и метрики: дизайн offline/online-оценки (TTR, точность ответов, WER, «полнота документа», бизнес-KPI), A/B, телеметрия, drift/guardrails.
MLOps: reproducible пайплайны (датасеты, эксперимент-трекинг, версии моделей), профилирование и оптимизация инференса (латентность/стоимость).
Безопасность/комплаенс: обезличивание ПДн, локализация данных, журналирование, политика запросов к внешним API.
Технологический стек
LLM/RAG: LangChain, OpenAI/Anthropic/DeepSeek/Local LLM (vLLM/llama.cpp), эмбеддинги, функции-инструменты (tools/functions).
Поиск/векторы: Elasticsearch (BM25 + KNN/HNSW), Faiss/Annoy (по необходимости).
ASR: Yandex SpeechKit / Whisper / Vosk / NeMo; post-processing, доменная лексика.
Данные/пайплайны: Python, PyTorch, Hugging Face, DVC/Weights & Biases, Kafka/Redis (желательно).
Dev/Infra: Docker, Linux, GitHub Actions, Yandex Cloud/on-prem GPU.
Требования
3+ года в ML/DS с практическим обучением моделей (NLP/ASR/IR).
Реальный опыт с ASR: адаптация под домен, сбор/чистка аудио, метрики WER/CER, пост-процессинг.
Опыт построения RAG: выбор схемы чанкинга, метаданных, негативных примеров, оценка ретривера/генерации.
LangChain: агенты, инструменты, маршрутизация, трейсинг; промпт-дизайн и защита от prompt-injection.
Работа с Elasticsearch: индексация, анализаторы, гибридный поиск, фильтры/фасеты, настройка KNN.
Умение доводить эксперименты до продакшена: профилировать, оптимизировать, мониторить.
Чистый Python, умение писать читаемые пайплайны, навыки статистики/оценки моделей.
Понимание требований к ПДн (локализация данных, обезличивание, журналы доступа).
Будет плюсом
Опыт с SpeechKit кастомизацией (лексиконы, user dictionaries, кастомные языковые/акустические модели).
Запуск/админка on-prem LLM (vLLM/llama.cpp), квантование, KV-кэш.
Медицинский/ветеринарный домен, опыт построения онтологий/словников.
Базовые навыки CV (рентген/УЗИ) — для взаимодействия с PetVision.
Формат работы
Полный/частичный день, удалёнка с обязательными слотами коммуникации; регулярные демо/валидирование с ветеринарными экспертами.
Плотное взаимодействие с backend/frontend, DevOps и врачами.
Что дадим
Живой продукт с быстрым циклом «гипотеза → пилот → метрика».
Возможность влиять на архитектуру ассистента и стандарты качества в отрасли.