разработка, настройка и поддержка LLM-решений: fine-tuning (с использованием Unsloth/LoRA), построение RAG- и агентных систем;
развертывание и мониторинг inference-сервисов, оптимизация производительности и стоимости (кеширование, управление контекстом, rate limiting);
обеспечение безопасности: защита от prompt injection, соблюдение data governance и установка policy guardrails;
ведение экспериментов с воспроизводимостью (MLflow), написание тестов (unit, golden, fuzzing), участие в CI/CD, документирование и соблюдение best practices.
Требования:
опыт интеграции OpenAI API, проектирования устойчивых промптов, построения RAG- и агентных систем, работа с векторными базами данных, data ingestion, fine-tuning;
уверенное применение MLOps-практик: управление экспериментами (MLflow), CI/CD для моделей, мониторинг в продакшене, тестирование (golden tests, fuzzing промптов);
навыки разработки в JupyterLab, интеграции с backend-сервисами;
свободное владение английским и китайским языками.
Условия:
релокация в Республику Татарстан;
конкурентный уровень з/п;
дневная рабочая неделя (ненормированная);
транспорт до работы из г. Елабуга, г. Набережные Челны, г. Менделеевск, г. Нижнекамск;
работа в крупной и стабильной компании – в структуре самой большой ОЭЗ в Европе.