Senior ML-инженер (Ташкент)

Ташкент, улица Батыра Закирова

Описание вакансии

NIS — это ведущий enterprise-вендор в сфере безопасного ИИ, специализирующийся на создании инфраструктурных платформ для автономных агентов. Мы разрабатываем собственные On-Premise решения, которые интегрируются в закрытые контуры государственных структур и корпораций на принципах Zero Trust.
Наша цель — предоставить бизнесу полную мощь генеративного ИИ, гарантируя абсолютную сохранность конфиденциальных данных.

Стек технологий: Python 3.12+, asyncio, FastAPI, Uvicorn, Pydantic v2, LiteLLM, vLLM, TGI, Ollama, LangChain, LlamaIndex, Qdrant, Chroma, Pinecone, Sentence-Transformers, OpenAI Embeddings, Unstructured, Chonkie, LangChain Text Splitters, FlashRank, Cohere, Presidio, NeMo Guardrails, Detoxify, OpenLLMetry, LangFuse, LangSmith, Prometheus, Docker, Kubernetes, CUDA, GPU, A10, A100, MinIO.

Чем предстоит заниматься?

Разрабатывать LLM routing и gateway слой;
Реализовывать и оптимизировать RAG-пайплайны;
Встраивать guardrails и AI safety механизмы;
Интегрировать LLM observability и трейсинг;
Оптимизировать inference по latency, throughput и стоимости;
Реализовывать evaluation-пайплайны качества ответов;
Работать с GPU-инфраструктурой и масштабированием.

Мы ожидаем:

Опыт: от 5 лет коммерческой разработки на позиции ML-инженера;
Production ML: реальный опыт вывода моделей в продуктивные среды, глубокое понимание жизненного цикла модели — от экспериментов до мониторинга;
RAG-архитектуры: практическая работа с векторными БД (Qdrant, Milvus, Weaviate, PGVector) и фреймворками (LangChain, LlamaIndex или кастомные решения);
Python: экспертное владение Python и async-стеком (asyncio, aiohttp, FastAPI);
Эксперименты: умение проектировать A/B-эксперименты, работать с метриками и интерпретировать результаты;
LLM: продуктовый опыт работы с большими языковыми моделями;
Безопасность: понимание рисков и принципов безопасности LLM-систем (prompt injection, data leakage, jailbreak).

Будет плюсом:

Agentic RAG и multi-agent системы;
Fine-tuning (LoRA, QLoRA, PEFT);
Multi-modal модели (vision, audio);
ASR, TTS, OCR, NER;
Оптимизация инференса (batching, KV-cache, quantization).

Почему мы?

Официальное оформление по ТК РУз;
Конкурентная заработная плата, которая определяется по итогам собеседования с учетом вашего опыта и экспертизы;
Просторный современный офис в деловом центре Tashkent City (в 2 минутах от ст.м. Узбекистанская);
Мы против тотального контроля. Нам важны измеримые показатели: качество контента, динамика роста и живой отклик целевой аудитории.

Посмотреть контакты работодателя