Алматы, Бостандыкский район
Метро: АлатауО компании:
ТОО "sPoint" - это инновационная IT-компания в Казахстане, специализирующаяся на разработке решений для повышения безопасности и эффективности в секторах нефти, газа и электроэнергии. Наш флагманский продукт - "Система Электронных Нарядов-Допусков", представляет собой первую в своем роде систему в Казахстане, которая цифровизирует, оптимизирует и улучшает процесс выдачи нарядов-допусков на проведение опасных работ.
Обязанности:
Развертывание и эксплуатация LLM в on-prem / private cloud среде (изоляция, обновления, контроль версий).
Подбор и конфигурация инфраструктуры: GPU-серверы, хранилища, сеть, мониторинг.
Построение inference-пайплайнов (API, очереди, батчинг), оптимизация latency/throughput/cost.
Настройка и дообучение моделей под задачи продукта (SFT, LoRA/QLoRA), управление датасетами.
Настройка QA-процесса для LLM/RAG: тесты, оценка, A/B, мониторинг деградации (drift) и регрессий.
Документирование архитектуры и handover в поддержку/DevOps (runbook, SLA/SLO, процедуры инцидентов).
Требования:
Знания LLM-стека: RAG и базы знаний (ingestion, vector search, reranking, доступы), inference/serving и оптимизация.
Опыт работы с LLM в продакшене и реальный опыт развертывания LLM on-prem (или в изолированном private cloud).
Понимание архитектуры LLM-систем:
Понимание требований enterprise-среды: безопасность, отказоустойчивость, масштабирование, аудит.
Условия: