Мы — ML команда финансовых продуктов Wildberries, одного из крупнейших маркетплейсов Европы с более чем 30 млн активных пользователей в день.
Мы строим масштабные end-to-end ML решения, развиваем высоконагруженную ML-инфраструктуру с нейросетями и десятками тысяч признаков, векторными, реляционными и in-memory базами данных. Открываем новые горизонты и продукты с помощью AI. Обеспечиваем ежедневный и онлайн инференс ML-моделей по базе свыше 100 миллионов клиентов.
Мы ищем опытного Middle/Senior MLE в нашу команду. Если готов строить новые продукты на базе LLM и нейросетей, внедрять чат-боты, агенты и различные помощники, обеспечивать высокие стандарты качества этих систем, эффективность инференса нейросетей и больших языковых моделей, выстраивать взаимодействия с командами backend/DevOps/DWH - нам по пути!
Стань частью команды!
Вам предстоит :
-
Проектировать и разрабатывать продукты с использованием LLM: RAG, чат-боты, агенты, помощники для написания кода, автогенерации тестов и многое другое;
-
Принять участие в различных проектах с использованием LLM, активно влиять на продуктовые метрики и применять последние наработки в области LLM/агентных систем;
-
Настраивать и оптимизировать скорости работы моделей;
-
Исследовать и внедрять современные архитектуры, а также подходы к обучению моделей;
-
Оптимизировать модели для production-среды (квантизация, дистилляция);
-
Разрабатывать стандарты и процессы обучения моделей и помощь другим командам в их внедрении;
-
Проводить RnD для улучшения продуктовых метрик бизнеса финтеха с применением новейших архитектур нейронных сетей.
Формат работы - гибридный или удаленный по договоренности с руководителем.
Вы нам подходите, если :
-
Имеете опыт работы в области LLM/DL/NN не менее 2-3 лет;
-
Понимаете современные архитектуры и методы обучения языковых моделей;
-
Уверенно владеете Python и ML/LLM инструментами (HuggingFace, PyTorch, transformers, accelerate, peft, vllm, LangChain, etc.);
-
Имеете интерес к сфере GenAI, опыт работы с популярными вендорными и open-source моделями (Qwen, Llama, DeepSeek, GPT-OSS);
-
Владеете практическим опытом создания решений на базе LLM (prompt engineering, RAG, function calling, structured outputs, reasoning, agents);
-
Понимаете методы оценки качества LLM (бенчмарки, human eval, LLM-as-as-Judge) и метрик для различных NLP-задач;
-
Имеете опыт с Airflow/Kubeflow, Spark, Kafka/RabbitMQ, ClickHouse;
-
Есть навыки работы с контейнерами (Docker, Kubernetes), CI/CD, мониторингом (Prometheus, Grafana).
Будет плюсом :
- Умение выводить нейросетевые модели в продакшен с помощью инференс систем, например, Triton Inference Server;
- Будет плюсом - опыт работы с векторными БД (Milvus/Qdrant, etc.);
- Будет плюсом - умение читать статьи .