Senior Data Scientist в MWS Data Copilot [Big Data, МТС Веб Сервисы]

МТС

Senior Data Scientist в MWS Data Copilot [Big Data, МТС Веб Сервисы]

Москва, Замоскворецкая линия, метро Технопарк

Метро: Технопарк

Описание вакансии

BIG DATA МТС – место, где телеком данные превращаются в реально работающие IT-продукты. Мы создали и протестировали несколько десятков сервисов. Самые успешные из них уже стали частью экосистемы МТС. Например, МТС Маркетолог, рекомендации в KION (МТС ТВ), услуга “Кто звонит?” или Спам blacklist.

КОГО МЫ ИЩЕМ?

Senior Data Scientist в продукт MWS Data Copilot

ОПИСАНИЕ ПРОДУКТА

MWS Data Copilot — ИИ-ассистент для работы с данными, который преобразует запросы на естественном языке в точные SQL-запросы и аналитические выводы. В основе лежит production-ready Text2SQL-конвейер на мультиагентной архитектуре: система самостоятельно разрешает schema linking среди тысяч таблиц DWH, динамически подбирает few-shot примеры через продвинутый RAG, генерирует и валидирует код, а качество ответов непрерывно улучшается через RLHF на реальных пользовательских логах. Вы будете проектировать семантический слой, выбирать между fine-tuning Open-Source LLM и закрытыми API, выстраивать eval-инфраструктуру и влиять на архитектуру с ранних этапов — это сильный инженерный кейс на стыке NLP, semantic parsing и production ML.

Наш стек: Python, PyTorch, Transformers, LangGraph/LangChain, vLLM/TGI, ClickHouse/PostgreSQL, Vector DBs, Kubernetes, FastAPI, MLflow.

ЧЕМ ПРЕДСТОИТ ЗАНИМАТЬСЯ

  • Проектировать и развивать конвейер Text-to-SQL: от классификации запроса до генерации и валидацииSQL;
  • Внедрять продвинутые техники: Agentic RAG (поиск релевантных таблиц/колонок), dynamic few-shot подбор примеров, Chain-of-Thought reasoning;
  • Разрабатывать компоненты schema linking, которые по вопросу пользователя находят релевантные сущности в DWH, решая проблему attention-окна модели;
  • Создавать «семантический слой»: абстрагировать физическую модель данных в бизнес-понятия (например, «активный пользователь» → сложное условие WHERE);
  • Реализовывать гибридный ML-подход: сравнивать и выбирать между продуктивизацией Open-Source LLM, дообученных под конкретную схему, и закрытыми API, а также внедрять систему обучения с подкреплением (RLHF/RLAIF) на реальных логах диалогов пользователей;
  • Внедрять RLHF/RLAIF-пайплайны на основе реальных диалогов пользователей для улучшения качества ответов;
  • Координировать группу из 2-3 ML-инженеров: декомпозиция задач, планирование спринтов, менторинг, code review;
  • Обеспечивать быстрое прототипирование гипотез с фокусом на eval и production-ready решения.

ЧТО НУЖНО ДЛЯ ЭТОЙ РАБОТЫ

  • Опыт работы в ML / NLP / LLM от 3 лет, из них 2+ года — разработка production AI-решений на базе LLM;
  • Глубокое понимание современных подходов: Transformer, attention, embeddings, instruction tuning, reasoning pipelines;
  • Практический опыт создания AI-агентов (1+ год): multi-step reasoning, tool calling, memory, planning; работа с LangGraph, LangChain, AutoGen или аналогами;
  • Экспертиза в MLOps/LLMOps: оптимизация инференса (KV-cache, quantization, speculative decoding), деплой на GPU, работа с vLLM/TGI/TensorRT-LLM;
  • Опыт построения RAG-систем: chunking, reranking, hybrid search, vector DBs; fine-tuning LLM (SFT, LoRA/QLoRA, DPO/RLHF — будет плюсом);
  • Опыт разработки Text2SQL / semantic parsing систем: schema linking, query planning, SQL validation, mitigation hallucinations;
  • Навыки оценки качества AI-систем: offline eval, benchmarking, detection hallucinations, метрики accuracy/faithfulness/latency/cost;
  • Уверенный Python, опыт backend-разработки (FastAPI, async, microservices), понимание CI/CD, Docker, Kubernetes;
  • Будет плюсом: опыт координации ML-команды (1+ год): roadmap, декомпозиция, техническое менторство, hiring.

ЧТО МЫ ПРЕДЛАГАЕМ:

  • собственную платформу MTS Ocean для получения ИТ-ресурсов, а это значит, что деплой, мониторинг, observability — не будут для тебя проблемой, ты сможешь сосредоточиться на фичах;
  • профессиональные гильдии инженеров, где мы поддерживаем друг друга и помогаем стать лучше;

  • внутреннюю площадку TechTalks для обмена опытом, дискуссий, развития навыков самопрезентации;

  • участие во внешних IT конференциях. Мы выступаем на HighLoad++, DataFest, Mobius, Test Driven Conf, Joker, DevOps, Матемаркетинг и даже проводим собственную конференцию по архитектуре True Tech Arch;

  • полезные курсы и вебинары в корпоративном университете и электронную библиотеку.

А ЕЩЕ:

  • ДМС с первого месяца работы, включая стоматологию;

  • страхование от несчастных случаев с 1 месяца работы. Материальную помощь в сложных жизненных ситуациях;

  • отпуск 28 календарных дней + 3 дополнительных дня по ненормированному графику;

  • прием врачей общей практики и массаж в офисе;

  • мобильная связь за счет компании и льготные тарифы для близких;

  • подписка на онлайн-кинотеатр KION, сервис МТС Музыка, книжный сервис Строки от МТС, безлимитные мессенджеры и соцсети.

Навыки
  • Python
  • PyTorch
  • Transformers
  • LangChain
  • vLLM
  • Clickhouse
  • MLflow
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Градиент
  • Москва

  • Не указана

Рекомендуем
РТЛабс
  • Москва

  • Не указана

Рекомендуем
М.Видео-Эльдорадо

Data Scientist (Senior)

М.Видео-Эльдорадо

  • Москва

  • Не указана

Рекомендуем
ИТ-Экспертиза
  • Москва

  • Не указана

Аптечная сеть Ваша №1 х Таблетка.ру

Data Scientist / ML Engineer

Аптечная сеть Ваша №1 х Таблетка.ру

  • Москва

  • Не указана

МФК ВЭББАНКИР

Chief Data Officer (CDO)

МФК ВЭББАНКИР

  • Москва

  • Не указана

Онкодиагностика Атлас

Senior / Lead Bioinformatics

Онкодиагностика Атлас

  • Москва

  • Не указана

Московская Биржа
  • Москва

  • Не указана

Okko
  • Москва

  • Не указана

Норникель

Team Lead MLOps

Норникель

  • Москва

  • Не указана

АТОЛ, группа компаний
  • Москва

  • Не указана

Криптонит

Senior Data Engineer (Scala)

Криптонит

  • Москва

  • Не указана

Эксперт РА
  • Москва

  • Не указана

НПФ Будущее

Team Lead Python

НПФ Будущее

  • Москва

  • Не указана

МТС
  • Москва

  • Не указана

Платежное Решение

Senior Python developer

Платежное Решение

  • Москва

  • Не указана

Лемана ПРО
  • Москва

  • Не указана

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию