ML-инженер

Описание вакансии

SalesAI — это ИТ-партнер компании Бина Групп.

В 2025 году LLM перестали быть игрушкой и стали драйвером выручки. SalesAI 2.0 — это не просто транскрибация звонков, это Deep Tech платформа, которая понимает сложные паттерны продаж (BANT, FFF, LAARC) лучше, чем сами менеджеры и увеличивает прибыль. Мы анализируем миллионы минут, вытаскиваем инсайты из хаоса живой речи и даем бизнесу (МТС, Газпром нефть и др.) инструмент для кратного роста конверсии.

Мы ищем ML/DS инженера, который превратит сырой текст и аудио в структурированные данные. Ты не просто «тренируешь модельки в ноутбуке», ты строишь RAG-конвейер, который работает в реальном времени, не галлюцинирует и выдает строгий JSON там, где другие LLM сдаются.

Что тебе предстоит:

  • Построить Production RAG Pipeline: Реализовать гибридный поиск (Dense + Sparse/BM25) для извлечения бизнес-сущностей (Свойства/Выгоды/Преимущества, BANT) с использованием Few-Shot примеров;

  • Укрощать LLM: Промпт-инжиниринг уровня God Mode (System prompts, Chain-of-Thought) для моделей Qwen/Llama/GPT-4o, чтобы получать валидный JSON со сложной вложенностью (FFF-фреймворк, обработка возражений);

  • Работать с ASR и Diarization: Оптимизация Whisper (large-v3), докрутка диаризации (Pyannote), борьба с шумами и склейкой спикеров;

  • Организовать Eval-loop: Настроить автоматическую оценку качества (LLM-as-a-Judge) и валидацию метрик (Precision/Recall) для каждого лейбла;

  • Деплоить и оптимизировать: vLLM, TGI, квантование моделей (AWQ/GPTQ) для влезания в GPU-бюджеты без потери качества.

Что мы ждём от тебя:

  • Уверенный Python: Pydantic, FastAPI, async — код должен летать в проде, а не умирать при нагрузке;

  • Глубокое понимание NLP: Transformers, Embeddings (e5/bge-m3), Vector DBs (Chroma/pgvector/Milvus);

  • Cursor/Codex/ClaudeCode — MUST HAVE: Ты пишешь код быстрее, чем думаешь, потому что умеешь делегировать рутину AI;

  • Опыт с LLM в проде: Знаешь, как заставить модель следовать JSON Schema, и понимаешь, чем RAG отличается от Fine-tuning (и когда нужно и то, и другое);

  • Математика и здравый смысл: Понимаешь метрики классификации, умеешь работать с несбалансированными данными и русским языком (морфология, сленг);

  • Не академический подход: Нам нужен результат (точность извлечения >90%), а не красивая статья на arXiv.

Будет круто, если ты:
Умеешь готовить Triton Inference Server, работал с ONNX/TensorRT, пробовал LoRA/QLoRA для дообучения локальных моделей на специфичных доменах продаж.

Условия:

  • Заработная плата 300 000-500 000 ₽/мес на руки (обсуждаемо при наличии уникальной экспертизы);

  • Оформление по ТК РФ с первого рабочего дня;

  • Опцион — за вклад в интеллектуальное ядро продукта;

  • Работа напрямую с фаундером и технической командой, где код деплоится, а не пылится;

  • Российская инфраструктура, но передовой стек (H100/A100 в доступе);

  • Никакого фитнеса и печенек — только хардкор, RAG, терабайты логов и задачи, от которых плавится мозг;

  • Твои алгоритмы будут напрямую влиять на миллиардные сделки наших клиентов.

Если тебе нравится сложность, когда нужно заставить нейронку «понимать» человеческую психологию продаж — пиши. В сопроводительном обязательно: твой любимый AI-IDE и лучший кейс использования LLM для структурирования данных (кратко).

Навыки
  • Python
  • PostgreSQL
  • Работа с базами данных
  • Анализ данных
  • Разработка ПО
  • Big Data
  • ETL
  • RAG
  • ONNX
  • TensorFlow
  • TensorRT
  • cursor
  • claude
  • Docker
  • vLLM
  • PyTorch
  • Pyannote
  • Pydantic
  • FastAPI
  • ChromaDB
  • pgvector
Посмотреть контакты работодателя

Похожие вакансии

Интерфакс

ML - инженер (СКАН)

Интерфакс

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Литрес

ML-инженер

Литрес

Удаленная работа
  • Москва

  • Не указана

Рекомендуем
Про.Потолок

Senior ML Engineer / Data Scientist

Про.Потолок

Удаленная работа
  • Москва

  • до 350000 RUR

Рекомендуем
Линсофтверпродакшн

Middle+ / Senior ML-инженер

Линсофтверпродакшн

Удаленная работа
  • Москва

  • до 330000 RUR

Bell Integrator
Удаленная работа
  • Москва

  • до 330000 RUR

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Data Science / ML Engineer / NLP Engineer

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Удаленная работа
  • Москва

  • до 330000 RUR

Октопустех
Удаленная работа
  • Москва

  • до 330000 RUR

RedLab
Удаленная работа
  • Москва

  • до 330000 RUR

ML инженер

Лоция

Удаленная работа
  • Москва

  • до 330000 RUR

Ozon
Удаленная работа
  • Москва

  • до 330000 RUR

Rubbles
Удаленная работа
  • Москва

  • до 310000 RUR

LionAdverts
Удаленная работа
  • Москва

  • от 450000 RUR

Топассистент

Senior ML Engineer

Топассистент

Удаленная работа
  • Москва

  • от 4000 EUR

Точка Банк

ML-инженер NLP

Точка Банк

Удаленная работа
  • Москва

  • до 570000 RUR

Innovative People
Удаленная работа
  • Москва

  • до 570000 RUR

getmatch
Удаленная работа
  • Москва

  • от 250000 RUR

Okko
Удаленная работа
  • Москва

  • от 250000 RUR

Devhunt
Удаленная работа
  • Москва

  • от 250000 RUR

Ozon
Удаленная работа
  • Москва

  • от 250000 RUR

«UZUM TECHNOLOGIES»
Удаленная работа
  • Москва

  • от 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию