Вместе с нами тебе предстоит: - Разработка и развитие AI-агентов и AI-продуктов.
- Построение и улучшение RAG и ML-пайплайнов.
- Оптимизация latency, стабильности и стоимости inference.
- Внедрение мониторинга качества моделей и сервисов.
- Интеграция AI-компонентов в продуктовую архитектуру.
- Участие в развитии AI-платформы и инженерных практик.
Какие навыки и знания для нас важны: - Коммерческий опыт fullstack-разработки от 5+ лет, из них 2+ лет с активным применением AI (LLM/ML).
- Практический опыт разработки и вывода в прод AI-агентов или AI-продуктов.
- Понимание архитектуры LLM-приложений (RAG, embeddings, orchestration, tools).
- Опыт работы с ML/NLP-пайплайнами в продакшене.
- Навыки оптимизации latency и стабильности AI-сервисов.
- Уверенные знания backend и frontend разработки.
- Работа с multi-agent системами или сложными агентными пайплайнами.
- Опыт оптимизации стоимости inference (token usage, caching, batching).
- Знание MLOps-практик и CI/CD для ML.
- Опыт построения AI-платформ или внутренних AI-инфраструктур.
- Глубокое понимание RAG (retrieval quality, chunking, reranking, evaluation).
- Опыт мониторинга качества моделей (offline/online метрики, A/B).
- Опыт управления коллективом-обязателен от 1 года.
Требования к личным качествам:
- Инженерное мышление и ориентация на результат.
- Проактивность в улучшении архитектуры и процессов.
- Готовность брать ownership за продуктовые куски.
- Умение работать в неопределенности и быстро проверять гипотезы.
- Коммуникабельность и способность объяснять сложные вещи просто.
- Интерес к новым AI-подходам и инструментам.
- Знание иностранного языка (уровень): не ниже B1.
Знание стека:
- Backend: Python (FastAPI), Node.js (NestJS/Express).
- Frontend: React / Next.js.
- LLM-стек: open-source модели, LangChain/аналоги.
- Базы данных: PostgreSQL, Redis.
- Инфраструктура: Docker, Kubernetes, облака.
Профессиональные навыки:
- Проектирование и разработка AI-агентов и LLM-приложений.
- Построение и оптимизация RAG-пайплайнов.
- Интеграция LLM с внешними сервисами и API.
- Оптимизация производительности (latency, throughput, cost).
- Настройка мониторинга и оценки качества моделей.
- Участие в архитектурных решениях и развитии платформы.
Специализированные программы:
- LangChain или аналоги.
- OpenAI API / HuggingFace / vLLM.
- Postman, Swagger.
- Prometheus, Grafana (или аналоги для мониторинга).
- GitHub / GitLab CI/CD.
- Airflow.