AI Engineer (LLM)

Санкт-Петербург, проспект Сизова, 9

Метро: Комендантский проспект

Описание вакансии

Комфортел — оператор связи для бизнеса с 17-летним опытом. Работаем со средним и крупным бизнесом, госучреждениями и другими операторами.

Мы — не бюрократическая корпорация, а компания, где решения принимаются быстро, и управление строится на здравом смысле, а не на сотнях регламентов.

Наши сотрудники — наша главная ценность. Средний срок работы в компании — 3,5 года, и это не случайность: мы инвестируем в людей, а они — в нас.

Мы растём ежегодно: по выручке, географии (офисы в СПб, Москве и Алматы) и команде.

Сейчас мы в поисках AI Engineer, которому интересна системная работа с большими языковыми моделями на всех этапах — от исследования и прототипирования до промышленного внедрения. В твоей зоне ответственности будет: выбор и адаптация моделей, проектирование архитектуры решений, построение автоматизированных пайплайнов, а также оценка качества и сопровождение в продуктивной среде.

Что мы предлагаем:

Свободу вместо регламентов: гибкий график, общение на «ты» и минимум бюрократии;
Просторный светлый офис у м. Комендантский проспект со всеми благами: чай, кофе, корпоративная библиотека, зона отдыха, кикер, автоматы со снеками, уютный сквер для обедов на свежем воздухе;
Официальное трудоустройство и работу в офисе (удаленный или гибридный формат работы предложить не можем);
Работу в сильной команде с возможностью многому научиться;
Карьеру без потолка: руководителей растим внутри, а не ищем на стороне;
Удобные рабочие места, оснащенные всем необходимым;
Дружный коллектив и непринужденную атмосферу.

Что нужно будет делать:

Проектирование и построение RAG-систем: подбор эмбеддингов, векторных баз данных, стратегий чанкинга и ранжирования;
Дообучение и адаптация LLM под задачи компании (fine-tuning, LoRA/QLoRA, PEFT);
Развёртывание и оптимизация локальных LLM (vLLM, llama.cpp, Ollama, TGI);
Prompt engineering: разработка системных промптов, цепочек рассуждений, few-shot стратегий;
Построение агентных систем и мультиагентных пайплайнов (tool use, function calling, планирование);
Проектирование и реализация автоматизированных рабочих процессов на базе no-code/low-code платформ (n8n, Make, Flowise, Langflow и аналоги);
Интеграция LLM через API и фреймворки (LangChain, LlamaIndex, CrewAI, AutoGen и др.);
Оценка качества ответов моделей: разработка eval-пайплайнов, бенчмарков и метрик;
Работа с мультимодальными моделями (vision, аудио, документы);
Исследование новых моделей, подходов и open-source решений, подготовка рекомендаций;
Настройка инфраструктуры: Docker-контейнеры, управление GPU-ресурсами, мониторинг;

Что мы ожидаем от вас:

Глубокое понимание принципов работы LLM: архитектура Transformer, токенизация, контекстное окно, температура, стратегии генерации;
Практический опыт работы с открытыми LLM (LLaMA, Mistral, Qwen, Gemma и т. д.);
Умение разворачивать модели локально и через API;
Опыт построения RAG-систем или понимание архитектуры на уровне, достаточном для самостоятельного проектирования;
Опыт работы с no-code/low-code платформами автоматизации (n8n, Make, Flowise, Langflow): построение сценариев, интеграция с внешними сервисами, подключение LLM-нод;
Знание Linux на уровне уверенного пользователя;
Умение работать с Docker;
Базовое владение хотя бы одним языком программирования или скриптинга для автоматизации и интеграций;
Умение читать техническую документацию на английском языке;
Навык быстро осваивать новые фреймворки и инструменты.

Будет преимуществом

Опыт prompt engineering в продуктовом контексте;
Знакомство с векторными БД (Qdrant, Milvus, ChromaDB, Weaviate);
Опыт работы с платформами для экспериментов (MLflow, W&B);
Понимание квантизации моделей (GPTQ, AWQ, GGUF);
Опыт с речевыми моделями (Whisper, TTS) или computer vision моделями;
Знакомство с Kubernetes;
Pet-проекты, публикации или активность в open-source сообществе.

Если ты самостоятельный специалист, готовый оперативно осваивать новые инструменты и способен трансформировать результаты экспериментов в устойчивые рабочие решения - ждём твоего отклика!

Посмотреть контакты работодателя