Мы развиваем корпоративную AI‑платформу в крупном банке, где инженеры строят LLM‑ и ML‑инференс на продакшн‑кластерах, RAG‑сервисы и инструменты для десятков внутренних команд. Это проект на стыке backend, DevOps и ML‑инженерии: много системного дизайна, высокие нагрузки, безопасный прод и реальное влияние на то, как бизнес использует ИИ каждый день.
Чем предстоит заниматься:
- Technical ownership ключевых компонентов AI Platform (ML + GenAI): от архитектуры и бэклога до продакшена и метрик надежности.
Проектирование и развитие core backend сервисов платформы:
- Model/LLM endpoint management (версии, маршрутизация, политики),
- usage metering / quotas / rate limits / cost controls,
- access control + audit services,
- integration layer для tool-calling / RAG / knowledge services.
Разработка сервисов вокруг LLM/ML inference:
- единые API и контракты,
- безопасная интеграция с внутренними системами,
- контроль качества и наблюдаемость (latency, errors, cost, answer quality signals).
- Совместно с AISec/Compliance: внедрение guardrails и security controls:
- политики доступа к данным/моделям,
- PII/секреты, контентная фильтрация,
- защита от prompt injection, безопасные шаблоны интеграций.
Построение и поддержка production-grade практик:
- CI/CD, тестирование (unit/integration/contract), релизы, rollback стратегии,
- performance и reliability (SLO/SLA), capacity planning,
- участие в on-call/разборе инцидентов, проведение postmortems.
- Создание “golden paths” для команд-потребителей платформы:
- reference implementations,
- шаблоны сервисов,
- библиотеки/SDK,
- документация и стандарты.
- Менторинг инженеров, развитие команды: техническое лидерство, подбор, проведение архитектурных ревью.
Требования:
- Опыт backend-разработки 5+ лет, из них 2+ года в роли senior/tech lead/архитектора или с выраженным technical ownership.
- Опыт проектирования и развития platform services и/или внутренних продуктов (PaaS, data platform, API platform).
- Сильные навыки системного дизайна: SLA/SLO, мульти-тенантность, отказоустойчивость, деградация, идемпотентность, backpressure, rate limiting.
- Уверенная работа с API-first подходом: REST/gRPC, версионирование контрактов, backward compatibility, contract testing.
- Практический опыт построения secure-by-design сервисов: OAuth2/OIDC, RBAC/ABAC, mTLS, secrets management, audit trails, PII/конфиденциальные данные.
- Опыт эксплуатации высоконагруженных систем: profiling, performance tuning, capacity planning, incident response (postmortems).
- Умение выстраивать инженерные практики: code review, quality gates, CI/CD, документация, “golden paths”, шаблоны сервисов.
- Коммуникация со стейкхолдерами: перевод требований бизнеса/рисков в технические решения и контроль их выполнения.