Компания BSS — системно значимая российская ИТ-компания, специализирующаяся на разработке, внедрении и поддержке решений по цифровизации клиентского обслуживания для банков, финтех-компаний, госсектора, телекома, ритейла, медицины, сферы ЖКХ в России и СНГ. Мы разрабатываем системы речевой аналитики, развиваем платформы дистанционного банковского обслуживания, а также оказываем услуги по заказной и аутсорс разработке. Мы практикуем наиболее востребованные рынком технологические решения: от машинного обучения до разработки 1С.
Обязанности:
Интеграция сторонних LLM API (OpenAI, Claude, DeepSeek) и кастомизация промптов.
Построение систем Retrieval-Augmented Generation (RAG): от чанкинга данных до поиска релевантных результатов.
Разработка чат-ботов и ассистентов с цепочками вызовов, памятью, fallback-механизмами.
Оптимизация стоимости вызовов LLM, работа с streaming и function calling.
Создание прототипов MVP интерфейсов для демонстрации решений (HTMX/Bootstrap/Streamlit).
Настройка инфраструктуры для работы с LLM: интеграция API, настройка кешей, очередей.
Работа с векторными базами данных (FAISS, Pinecone) и графами знаний.
Внедрение решений по квантованию моделей и fallback на локальные модели GPT.
Мониторинг метрик и логирование работы систем.
Требования:
Глубокая экспертиза в Python: asyncio, threading, multiprocessing, профилирование памяти/CPU-bound задач.
Уверенное владение FastAPI + Pydantic v2 (асинхронная архитектура).
Опыт работы с базами данных: PostgreSQL, Redis, MongoDB — проектирование схем, индексация.
Контейнеризация: Docker, Docker Compose; базовое понимание Kubernetes.
Опыт настройки очередей сообщений: RabitMQ, Kafka; Celery — retry-логика, dead-letter очереди.
Навыки быстрого прототипирования интерфейсов (HTMX/Bootstrap/Streamlit).
Способность быстро собирать MVP за короткое время.
Самостоятельность в постановке задач и выборе архитектурных решений.
Желательные навыки:
Работа с LLM API (OpenAI, Claude), кастомизация промптов.
Построение RAG-систем: выбор векторных БД и графов знаний.
Работа с ML-инфраструктурой: TorchServe, Triton Inference Server.
Знание MLOps инструментов: MLflow, Weights & Biases.
Условия: