Ищем Middle+/Senior Data Scientist в команду Умного поиска Самоката.
Основной фокус: улучшение качества ответов и выдачи, работа с поисковым пайплайном, LLM/RAG и аналитикой качества, плюс реализация изменений в Python-коде сервиса.
Задачи:
Наши ожидания:
- Хороший Python (чистый код, тесты, работа с продовым кодом).
- Сильная база в метриках и экспериментах.
- LLM, RAG, prompt engineering.
- Опыт с эмбеддингами для поиска
- Умение проводить error analysis и превращать его в продуктовые гипотезы.
Желательные навыки:
- Опыт работы с high-load системами
- Опыт фаинтюна LoRA-моделей
Стек команды:
Разработка: Python, PyTorch, FastAPI, Pydantic, GitLab, Docker, Prometheus, Grafana;
ML инфраструктура: JupyterHub, MLFlow, Airflow, PostgreSQL;
ML: Transformers, SGLang, Triton;
Процессы: Jira, Confluence.