ML - разработчик

Новые Ветеринарные Технологии

ML - разработчик

Описание вакансии

Проект: МетаПетс — ИИ-экосистема для ветеринарных клиник (веб для врача, мобайл для владельца, интеграция с МИС).
Фокус роли: обучение и внедрение моделей ИИ в модули ассистента и транскрибации (ASR), построение RAG, работа с LangChain и API крупных провайдеров.

Что будете делать

ASR (речь → текст): подбор/обучение/тонкая настройка русскоязычных моделей, доменная адаптация под ветеринарные термины; оценка качества (WER/CER), пайплайн пост-процессинга и нормализации, сохранение аудио-трэков к визитам.

LLM-ассистент: проектирование промптов и системных сообщений, внедрение RAG (ретривер, индексация, чанкинг, метаданные), построение агентной логики (действия в МИС/поиск по БЗ) на LangChain.

Инфраструктура и интеграции: работа с Elasticsearch (гибридный/векторный поиск), объектным хранилищем, очередями; on-prem/облачные LLM (в т.ч. приватные эндпоинты), конфигурация ограничений и фолбэков.

Качество и метрики: дизайн offline/online-оценки (TTR, точность ответов, WER, «полнота документа», бизнес-KPI), A/B, телеметрия, drift/guardrails.

MLOps: reproducible пайплайны (датасеты, эксперимент-трекинг, версии моделей), профилирование и оптимизация инференса (латентность/стоимость).

Безопасность/комплаенс: обезличивание ПДн, локализация данных, журналирование, политика запросов к внешним API.

Технологический стек

LLM/RAG: LangChain, OpenAI/Anthropic/DeepSeek/Local LLM (vLLM/llama.cpp), эмбеддинги, функции-инструменты (tools/functions).

Поиск/векторы: Elasticsearch (BM25 + KNN/HNSW), Faiss/Annoy (по необходимости).

ASR: Yandex SpeechKit / Whisper / Vosk / NeMo; post-processing, доменная лексика.

Данные/пайплайны: Python, PyTorch, Hugging Face, DVC/Weights & Biases, Kafka/Redis (желательно).

Dev/Infra: Docker, Linux, GitHub Actions, Yandex Cloud/on-prem GPU.

Требования

3+ года в ML/DS с практическим обучением моделей (NLP/ASR/IR).

Реальный опыт с ASR: адаптация под домен, сбор/чистка аудио, метрики WER/CER, пост-процессинг.

Опыт построения RAG: выбор схемы чанкинга, метаданных, негативных примеров, оценка ретривера/генерации.

LangChain: агенты, инструменты, маршрутизация, трейсинг; промпт-дизайн и защита от prompt-injection.

Работа с Elasticsearch: индексация, анализаторы, гибридный поиск, фильтры/фасеты, настройка KNN.

Умение доводить эксперименты до продакшена: профилировать, оптимизировать, мониторить.

Чистый Python, умение писать читаемые пайплайны, навыки статистики/оценки моделей.

Понимание требований к ПДн (локализация данных, обезличивание, журналы доступа).

Будет плюсом

Опыт с SpeechKit кастомизацией (лексиконы, user dictionaries, кастомные языковые/акустические модели).

Запуск/админка on-prem LLM (vLLM/llama.cpp), квантование, KV-кэш.

Медицинский/ветеринарный домен, опыт построения онтологий/словников.

Базовые навыки CV (рентген/УЗИ) — для взаимодействия с PetVision.

Формат работы

Полный/частичный день, удалёнка с обязательными слотами коммуникации; регулярные демо/валидирование с ветеринарными экспертами.

Плотное взаимодействие с backend/frontend, DevOps и врачами.

Что дадим

Живой продукт с быстрым циклом «гипотеза → пилот → метрика».

Возможность влиять на архитектуру ассистента и стандарты качества в отрасли.

Посмотреть контакты работодателя

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию