Мы компания KOZ AI Мы - продуктовая ИИ-компания. Миссия должности:
Забрать на себя всю инфраструктуру компании. Выстроить надежный, автоматизированный фундамент (CI/CD, IaC) и обеспечить безопасный деплой тяжелых LLM-решений в закрытых On-Premise контурах наших Enterprise-клиентов.
Обязанности:
- Автоматизация CI/CD: Перевести 100% ручных деплоев на автоматизированные пайплайны. Инфраструктура описана как код (IaC: Terraform, Helm).
- Разделение сред: Полностью организовать и изолировать рабочие среды: Local, Stage, Prod.
- MLOps и GPU: Успешно развернуть и оптимизировать (квантование, тензоризация) локальные open-source модели (Llama 3, Mistral) на GPU-серверах (RunPod, AWS, bare-metal заказчика) (опционально - готовы обучить)
- Observability: Внедрить систему мониторинга и алертинга (Prometheus, Grafana, Loki/ELK) для серверов, API и контроля расхода токенов LLM.
- Безопасность (Enterprise-grade): Обеспечить соответствие инфраструктуры требованиям ИБ крупных компаний (изоляция данных, закрытые контуры).
- Data Data & High-load: Поддерживать стабильную работу K8s, Kafka, Redis и заложить архитектуру для Data Lake (Apache Iceberg).
Необходимые компетенции (Technical & Behavioral):
- Твердая база: Глубокое практическое понимание Linux, Docker и Kubernetes (это фундамент, без него не берем).
- IaC & CI/CD: Понимание Terraform и Helm. Умение писать пайплайны.
- Гибридная инфраструктура: Понимание принципов работы Cloud (AWS/GCP/Яндекс) + On-Premise железа.
- Обучаемость (Learning Agility): Сильный интерес к MLOps, PyTorch, RAG и работе с GPU-кластерами. Мы готовы обучать специфике AI, если у вас есть крепкая DevOps-база.
- Проактивность: Способность брать ответственность за инфраструктуру целиком, а не ждать прямых указаний по каждой задаче.
Наш стек:
- Core Infra: Kubernetes, Terraform/Helm, Гибрид Cloud + On-Premise.
- AI/ML: PyTorch, RAG, локальные LLM, GPU-инфраструктура.
- Data/Services: Apache Iceberg, Kafka, Redis, FastAPI, Service Mesh.
- Observability: Prometheus, Grafana, Loki/ELK.
Что Мы предлагаем:
- График работы: 5/2, Офис / Гибрид, Full-time;
- Обучение и поддержку для достижения лучших результатов;
- Официальное трудоустройство;
- Стабильную заработную плату;
- Карьерный рост в одной из крупной ИИ-компании.
Прямой путь в Core-команду. Вы будете работать бок о бок с сильными инженерами. При успешном выполнении Outcomes, ваш переход на позицию Senior DevOps/MLOps займет месяцы, а не годы.