Астана, проспект Мангилик Ел, С3.5
О компании:
SHAI.PRO — казахстанская AI-компания, создающая интеллектуальных агентов и GenAI-платформы для крупных организаций.
Наша цель — стать ключевым AI-игроком в регионе и экспортировать AI-продукты за пределы Казахстана.
О роли:
Нужен системный архитектор, который будет отвечать за проектирование технической платформы, взаимодействие между сервисами и стандарты разработки.
Формат: offline
Город: Астана
Задачи:
Требования:
Опыт от 5+ лет в разработке ПО
Не менее 4 лет как разработчик на продуктовых проектах с реальной нагрузкой: асинхронный код, проектирование схем БД, поддержка сервисов в продакшене, отладка проблем с производительностью, утечки памяти, race conditions, дедлоки.
Не менее 2 лет как системный/solution-архитектор или техлид с ответственностью за архитектуру продукта: проектирование систем с нуля, выбор стека, защита технических решений.
Технические компетенции
Проектирование систем:
Микросервисная и событийно-ориентированная архитектура (Saga, CQRS, Outbox). API-дизайн: REST, gRPC, GraphQL — версионирование, обратная совместимость, идемпотентность.
Брокеры сообщений: Kafka, RabbitMQ, NATS.
Базы данных: PostgreSQL, Redis, MongoDB, ClickHouse — индексы, шардирование, репликация.
Кэширование и инвалидация.
Распределённые системы:
CAP, eventual consistency, идемпотентность.
Распределённые транзакции, компенсирующие операции.
Отказоустойчивость: circuit breaker, retry с backoff, bulkhead, graceful degradation. Профилирование и нагрузочное тестирование.
Инфраструктура:
Docker, Docker Swarm/Kubernetes. CI/CD: blue-green и canary-деплой. Observability: логирование, метрики (Prometheus), трейсинг (OpenTelemetry, Jaeger). Безопасность: OAuth2, JWT, mTLS, OWASP Top 10.
ML-инфраструктура:
Serving моделей (Triton, TorchServe, vLLM), батчинг, GPU-планирование. Версионирование моделей, A/B-тесты, мониторинг drift. LLM: оркестрация агентов, RAG, vector-БД (Qdrant, Weaviate, pgvector), управление контекстом и токен-бюджетом.
Стек:
Python (основной), Go и Rust (для критичных по производительности модулей), Next.js/React, Docker Swarm, ML-модели в продакшене.
Глубокая экспертиза по всему стеку не обязательна — важнее архитектурное мышление. Python и контейнеризация — базовое требование.
Условия:
Работа над реальными AI-продуктами, а не прототипами
Быстрые итерации и живые клиенты
Минимум бюрократии
Прямая коммуникация с технической командой
Возможность профессионального роста