ML/AI Engineer (Middle/Senior)

Описание вакансии

Мы — ML команда финансовых продуктов Wildberries, одного из крупнейших маркетплейсов Европы с более чем 30 млн активных пользователей в день.
Мы строим масштабные end-to-end ML решения, развиваем высоконагруженную ML-инфраструктуру с нейросетями и десятками тысяч признаков, векторными, реляционными и in-memory базами данных. Открываем новые горизонты и продукты с помощью AI. Обеспечиваем ежедневный и онлайн инференс ML-моделей по базе свыше 100 миллионов клиентов.

Мы ищем опытного Middle/Senior MLE в нашу команду. Если готов строить новые продукты на базе LLM и нейросетей, внедрять чат-боты, агенты и различные помощники, обеспечивать высокие стандарты качества этих систем, эффективность инференса нейросетей и больших языковых моделей, выстраивать взаимодействия с командами backend/DevOps/DWH - нам по пути!

Стань частью команды!

Вам предстоит :

Проектировать и разрабатывать продукты с использованием LLM: RAG, чат-боты, агенты, помощники для написания кода, автогенерации тестов и многое другое;
Принять участие в различных проектах с использованием LLM, активно влиять на продуктовые метрики и применять последние наработки в области LLM/агентных систем;
Настраивать и оптимизировать скорости работы моделей;
Исследовать и внедрять современные архитектуры, а также подходы к обучению моделей;
Оптимизировать модели для production-среды (квантизация, дистилляция);
Разрабатывать стандарты и процессы обучения моделей и помощь другим командам в их внедрении;
Проводить RnD для улучшения продуктовых метрик бизнеса финтеха с применением новейших архитектур нейронных сетей.

Формат работы - гибридный или удаленный по договоренности с руководителем.

Вы нам подходите, если :

Имеете опыт работы в области LLM/DL/NN не менее 2-3 лет;
Понимаете современные архитектуры и методы обучения языковых моделей;
Уверенно владеете Python и ML/LLM инструментами (HuggingFace, PyTorch, transformers, accelerate, peft, vllm, LangChain, etc.);
Имеете интерес к сфере GenAI, опыт работы с популярными вендорными и open-source моделями (Qwen, Llama, DeepSeek, GPT-OSS);
Владеете практическим опытом создания решений на базе LLM (prompt engineering, RAG, function calling, structured outputs, reasoning, agents);
Понимаете методы оценки качества LLM (бенчмарки, human eval, LLM-as-as-Judge) и метрик для различных NLP-задач;
Имеете опыт с Airflow/Kubeflow, Spark, Kafka/RabbitMQ, ClickHouse;
Есть навыки работы с контейнерами (Docker, Kubernetes), CI/CD, мониторингом (Prometheus, Grafana).

Будет плюсом :

Умение выводить нейросетевые модели в продакшен с помощью инференс систем, например, Triton Inference Server;
Будет плюсом - опыт работы с векторными БД (Milvus/Qdrant, etc.);
Будет плюсом - умение читать статьи .

Посмотреть контакты работодателя