ML/NLP-инженер

Группа компаний Экзон

ML/NLP-инженер

Описание вакансии

Экзон Групп — ведущий разработчик и интегратор инновационных IT-решений в сфере строительства. Мы разрабатываем облачную платформу EXON, предназначенную для автоматизации и оптимизации строительных процессов.

Наша миссия — объединить всех участников строительного процесса на одной платформе, обеспечивая прозрачность и ясность на каждом этапе работы.

Ищем специалиста по большим языковым моделям для продукта в сфере ИИ.

Обязанности:

- Разрабатывать и оптимизировать продакшен-конвейер транскрипции аудио/видео: VAD, сегментация, диаризация, постобработка, разметка таймкодов, сбор агрегированных метрик по коммуникациям.

- Внедрять и поддерживать пайплайн извлечения знаний из текстов и транскриптов: лемматизация, NER, нормализация сущностей, сентимент/эмоциональная окраска, тематическое моделирование, классификация коммуникативных ролей и типов взаимодействий.

- Проектировать доменно-ориентированные модели/правила под корпоративный контекст: сущности «организация/проект/площадка/документ/задача/персона/роль», устойчивые словари и нормализацию терминов, работу с шумными данными (чат, переговоры, совещания).

- Разрабатывать модели и метрики риск-скоринга для команд и процессов: выгорание/конфликтность, эскалации, деградация коммуникаций, а также поддерживающие объяснения (факторы, вклад признаков, доказательная база).

- Строить автоматизированные quality gates для моделей и пайплайнов: датасеты, протоколы валидации, ROC AUC/PR-AUC/Precision/Recall/F1, устойчивость к дрейфу данных, регресс-тесты качества на ключевых сценариях.

- Организовывать MLOps-жизненный цикл: версионирование данных и моделей, воспроизводимость экспериментов, MLflow/DVC, CI для ML (юнит/интеграционные тесты, контроль качества данных и артефактов, релизные чек-листы).

- Оптимизировать инференс на GPU/CPU: батчинг, half-precision, квантование/ONNX при необходимости, профилирование и устранение узких мест.

- Совместно с Backend-инженером интегрировать результаты аналитики в контуры продукта: запись в хранилища (raw/silver/gold), публикация событий, подготовка API-контрактов, участие в код-ревью, повышение производительности и надёжности сервиса.

- Участвовать в разработке агентных сценариев: подготовка признаков/эмбеддингов, retrieval по векторным/графовым индексам, оценка качества на типовых сценариях.

Требования:

- Продвинутое владение Python с упором на научный стек (NumPy, pandas, Jupyter), умение писать поддерживаемый продакшен-код.

- Практический опыт настройки и инференса STT/диаризации на своих данных: подготовка датасетов, оценка качества, обработка шумов и разных доменов речи.

- Опыт обучения/дообучения трансформеров под прикладные задачи: NER, классификация, тематическое моделирование, retrieval-эмбеддинги.

- Понимание и практический опыт тематического моделирования (LDA, HDBSCAN + SBERT/эмбеддинги), интерпретация тем и устойчивость результатов.

- Навыки оптимизации инференса: батчинг, mixed precision, профилирование, понимание ограничений GPU/CPU и стоимости вычислений.

- Опыт упаковки ML в сервисы (REST/gRPC), работа с контрактами, схемами данных и интеграцией в backend.

- Опыт построения CI для ML-задач: тесты качества моделей, проверки датасетов, контроль дрейфа и регрессий, воспроизводимость экспериментов.

- Понимание принципов A/B-валидации, мониторинга в проде (качество, дрейф, задержки, ресурсы), алертинг.

- Желательно: опыт с графовыми/векторными хранилищами, построением индексов для поиска и последующей аналитики; опыт с event-driven архитектурой (Kafka).

​​​​​​​- Важно: аккуратная работа с чувствительными данными сотрудников (анонимизация/псевдонимизация, контроль доступа, минимизация данных, этичность метрик).

Условия:

  • Официальное трудоустройство с "белой" заработной платой;
  • Ценим права наших сотрудников, поэтому предоставляем полный соцпакет по ТК РФ;
  • Удаленный формат работы;
  • Достойный уровень зарплаты, обсуждается по итогам собеседования;
  • Открытая корпоративная культура, где ваши идеи могут стать реальностью;
  • А ещё у нас активная корпоративная жизнь!
Посмотреть контакты работодателя

Похожие вакансии

Онлайн-школа Тетрика

ML Engineer

Онлайн-школа Тетрика

  • Москва

  • Не указана

Рекомендуем
Marfatech
  • Москва

  • Не указана

Рекомендуем
KAMEN Architects

ML-инженер

KAMEN Architects

  • Москва

  • до 200000 RUR

Рекомендуем
ProBack

AI/ML Engineer

ProBack

  • Москва

  • до 200000 RUR

МФК Фордевинд

ML-инженер

МФК Фордевинд

  • Москва

  • до 200000 RUR

Северсталь

ML-инженер (NLP)

Северсталь

  • Москва

  • до 200000 RUR

TeachMeSkills
  • Москва

  • до 200000 RUR

ML Engineer / Инженер по машинному обучению

Аккредитованная ИТ компания

  • Москва

  • до 200000 RUR

Voximplant

Middle ML Engineer

Voximplant

  • Москва

  • до 200000 RUR

ICVR
  • Москва

  • до 200000 RUR

KTS
  • Москва

  • до 200000 RUR

Рекрутинговое агентство The One

Middle Data Scientist / ML-разработчик

Рекрутинговое агентство The One

  • Москва

  • до 250000 RUR

СБЕР
  • Москва

  • до 250000 RUR

Хэндсапп

ML-инженер

Хэндсапп

  • Москва

  • до 250000 RUR

СБЕР
  • Москва

  • до 250000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию