Lead Platform Backend Engineer

Описание вакансии

Мы развиваем корпоративную AI‑платформу в крупном банке, где инженеры строят LLM‑ и ML‑инференс на продакшн‑кластерах, RAG‑сервисы и инструменты для десятков внутренних команд. Это проект на стыке backend, DevOps и ML‑инженерии: много системного дизайна, высокие нагрузки, безопасный прод и реальное влияние на то, как бизнес использует ИИ каждый день.

Чем предстоит заниматься:

Technical ownership ключевых компонентов AI Platform (ML + GenAI): от архитектуры и бэклога до продакшена и метрик надежности.

Проектирование и развитие core backend сервисов платформы:

Model/LLM endpoint management (версии, маршрутизация, политики),
usage metering / quotas / rate limits / cost controls,
access control + audit services,
integration layer для tool-calling / RAG / knowledge services.

Разработка сервисов вокруг LLM/ML inference:

единые API и контракты,
безопасная интеграция с внутренними системами,
контроль качества и наблюдаемость (latency, errors, cost, answer quality signals).
Совместно с AISec/Compliance: внедрение guardrails и security controls:
- политики доступа к данным/моделям,
- PII/секреты, контентная фильтрация,
- защита от prompt injection, безопасные шаблоны интеграций.

Построение и поддержка production-grade практик:

CI/CD, тестирование (unit/integration/contract), релизы, rollback стратегии,
performance и reliability (SLO/SLA), capacity planning,
участие в on-call/разборе инцидентов, проведение postmortems.
Создание “golden paths” для команд-потребителей платформы:
- reference implementations,
- шаблоны сервисов,
- библиотеки/SDK,
- документация и стандарты.
Менторинг инженеров, развитие команды: техническое лидерство, подбор, проведение архитектурных ревью.

Требования:

Опыт backend-разработки 5+ лет, из них 2+ года в роли senior/tech lead/архитектора или с выраженным technical ownership.
Опыт проектирования и развития platform services и/или внутренних продуктов (PaaS, data platform, API platform).
Сильные навыки системного дизайна: SLA/SLO, мульти-тенантность, отказоустойчивость, деградация, идемпотентность, backpressure, rate limiting.
Уверенная работа с API-first подходом: REST/gRPC, версионирование контрактов, backward compatibility, contract testing.
Практический опыт построения secure-by-design сервисов: OAuth2/OIDC, RBAC/ABAC, mTLS, secrets management, audit trails, PII/конфиденциальные данные.
Опыт эксплуатации высоконагруженных систем: profiling, performance tuning, capacity planning, incident response (postmortems).
Умение выстраивать инженерные практики: code review, quality gates, CI/CD, документация, “golden paths”, шаблоны сервисов.
Коммуникация со стейкхолдерами: перевод требований бизнеса/рисков в технические решения и контроль их выполнения.