it-компания gnivc- партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга.
- Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh среди крупных компаний;
- Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job;
- У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата;
- Являемся аккредитованной ИТ-компанией.
Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей.
Основной фокус — стабильный и эффективный инференс, интеграция моделей в сервисы и развитие платформы ИИ в on-prem / изолированном контуре.
задачи:
-
Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.);
-
Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache);
-
Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование);
-
Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование);
-
Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация);
-
Интегрировать модели в корпоративные системы через REST/gRPC;
-
Участвовать в построении RAG-систем (эмбеддинги, поиск, векторные базы данных);
-
Настраивать мониторинг (метрики, логи, трассировки, алерты);
-
Диагностировать и устранять проблемы в промышленной эксплуатации (узкие места, деградации, OOM, проблемы GPU);
-
Оптимизировать использование ресурсов (GPU/CPU/хранилище/сеть);
-
Работать с CI/CD пайплайнами для деплоя моделей и сервисов;
-
Плотно взаимодействовать с командой информационной безопасности;
-
Обеспечивать соблюдение требований и практик информационной безопасности при разработке и эксплуатации систем ИИ;
-
Взаимодействовать с командами Data Science, Backend и Platform Engineering.
мы от вас ждём:
- 4+ года опыта в MLOps / DevOps / инфраструктурной разработке;
- Практический опыт работы с Kubernetes;
- Опыт работы с GPU (NVIDIA stack, nvidia-smi, CUDA);
- Опыт запуска и эксплуатации ML/LLM моделей в промышленной эксплуатации;
- Уверенное владение Python;
- Понимание принципов работы инференса LLM (токены, контекст, задержки, батчинг);
- Опыт работы с Linux на уровне диагностики и отладки;
- Понимание сетевого взаимодействия (HTTP, TLS, прокси, балансировка);
- Опыт работы с CI/CD;
- Понимание и соблюдение базовых принципов и «гигиены» информационной безопасности;
- Умение разбираться в логах и находить первопричины проблем.
Будем плюсом:
- Опыт с vLLM / GPUStack / Triton / TensorRT-LLM;
- Опыт работы с LiteLLM или аналогичными прокси/шлюзами;
- Опыт построения RAG-систем (векторные БД, эмбеддинги);
- Опыт работы с Milvus / Qdrant / pgvector;
- Опыт оптимизации инференса (квантизация, параллелизм, шардинг);
- Опыт работы с высоконагруженными системами;
- Опыт работы в изолированных (air-gapped) средах;
- Опыт настройки Prometheus / Grafana для ML-сервисов;
- Понимание требований регуляторов (152-ФЗ, ГОСТ).
Стек:
- Инфраструктура: Kubernetes, Docker, Helm;
- Инференс: vLLM, llama.cpp, Triton, HuggingFace;
- API / шлюзы: OpenAI-совместимый API, LiteLLM, Envoy / Nginx
- RAG / данные: векторные БД (Milvus, Qdrant, pgvector), Kafka, S3/MinIO;
- Мониторинг: Prometheus, Grafana, ELK;
- CI/CD: GitLab CI/CD, Jenkins, ArgoCD;
- Инфраструктура как код: Terraform, Ansible;
- Языки: Python (обязательно), Bash, SQL.
мы предлагаем:
- Возможность работы в офисе, по гибридному графику или полностью дистанционно на территории РФ;
- Рабочий график: пятидневная рабочая неделя (Пн. – Чт. с 09:00 до 18:00, Пт. с 09:00 до 16:45);
- Достойное вознаграждение: конкурентная заработная плата по результатам собеседования, а также премии за эффективную работу и достигнутые результаты;
- Официальное трудоустройство: полное соблюдение требований ТК РФ, включая оплачиваемые отпуска (с дополнительной выплатой 50% от оклада после 11 месяцев работы в Компании) и выплату заработной платы дважды в месяц;
- Заботу о здоровье:
Компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню.
Добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию.
Возмещение до 50% затрат на занятия спортом.
Профессиональное обучение и сертификация за счет компании.
Организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов.
Партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox.
Доступ к корпоративной библиотеке на платформе Alpina Digital.
- Дополнительные выходные: возможность взять 5 дополнительных оплачиваемых выходных (ресурсных) дней в течение календарного года (с 1 января до 31 декабря) для сотрудников, проработавших в компании более 11 месяцев.