Комфортел — оператор связи для бизнеса с 17-летним опытом. Работаем со средним и крупным бизнесом, госучреждениями и другими операторами.
Мы — не бюрократическая корпорация, а компания, где решения принимаются быстро, и управление строится на здравом смысле, а не на сотнях регламентов.
Наши сотрудники — наша главная ценность. Средний срок работы в компании — 3,5 года, и это не случайность: мы инвестируем в людей, а они — в нас.
Мы растём ежегодно: по выручке, географии (офисы в СПб, Москве и Алматы) и команде.
Сейчас мы в поисках AI Engineer, которому интересна системная работа с большими языковыми моделями на всех этапах — от исследования и прототипирования до промышленного внедрения. В твоей зоне ответственности будет: выбор и адаптация моделей, проектирование архитектуры решений, построение автоматизированных пайплайнов, а также оценка качества и сопровождение в продуктивной среде.
Что мы предлагаем:
-
Свободу вместо регламентов: гибкий график, общение на «ты» и минимум бюрократии;
-
Просторный светлый офис у м. Комендантский проспект со всеми благами: чай, кофе, корпоративная библиотека, зона отдыха, кикер, автоматы со снеками, уютный сквер для обедов на свежем воздухе;
-
Официальное трудоустройство и работу в офисе (удаленный или гибридный формат работы предложить не можем);
- Работу в сильной команде с возможностью многому научиться;
- Карьеру без потолка: руководителей растим внутри, а не ищем на стороне;
- Удобные рабочие места, оснащенные всем необходимым;
- Дружный коллектив и непринужденную атмосферу.
Что нужно будет делать:
- Проектирование и построение RAG-систем: подбор эмбеддингов, векторных баз данных, стратегий чанкинга и ранжирования;
- Дообучение и адаптация LLM под задачи компании (fine-tuning, LoRA/QLoRA, PEFT);
- Развёртывание и оптимизация локальных LLM (vLLM, llama.cpp, Ollama, TGI);
- Prompt engineering: разработка системных промптов, цепочек рассуждений, few-shot стратегий;
- Построение агентных систем и мультиагентных пайплайнов (tool use, function calling, планирование);
- Проектирование и реализация автоматизированных рабочих процессов на базе no-code/low-code платформ (n8n, Make, Flowise, Langflow и аналоги);
- Интеграция LLM через API и фреймворки (LangChain, LlamaIndex, CrewAI, AutoGen и др.);
- Оценка качества ответов моделей: разработка eval-пайплайнов, бенчмарков и метрик;
- Работа с мультимодальными моделями (vision, аудио, документы);
- Исследование новых моделей, подходов и open-source решений, подготовка рекомендаций;
- Настройка инфраструктуры: Docker-контейнеры, управление GPU-ресурсами, мониторинг;
Что мы ожидаем от вас:
- Глубокое понимание принципов работы LLM: архитектура Transformer, токенизация, контекстное окно, температура, стратегии генерации;
- Практический опыт работы с открытыми LLM (LLaMA, Mistral, Qwen, Gemma и т. д.);
- Умение разворачивать модели локально и через API;
- Опыт построения RAG-систем или понимание архитектуры на уровне, достаточном для самостоятельного проектирования;
- Опыт работы с no-code/low-code платформами автоматизации (n8n, Make, Flowise, Langflow): построение сценариев, интеграция с внешними сервисами, подключение LLM-нод;
- Знание Linux на уровне уверенного пользователя;
- Умение работать с Docker;
- Базовое владение хотя бы одним языком программирования или скриптинга для автоматизации и интеграций;
- Умение читать техническую документацию на английском языке;
- Навык быстро осваивать новые фреймворки и инструменты.
Будет преимуществом
- Опыт prompt engineering в продуктовом контексте;
- Знакомство с векторными БД (Qdrant, Milvus, ChromaDB, Weaviate);
- Опыт работы с платформами для экспериментов (MLflow, W&B);
- Понимание квантизации моделей (GPTQ, AWQ, GGUF);
- Опыт с речевыми моделями (Whisper, TTS) или computer vision моделями;
- Знакомство с Kubernetes;
- Pet-проекты, публикации или активность в open-source сообществе.
Если ты самостоятельный специалист, готовый оперативно осваивать новые инструменты и способен трансформировать результаты экспериментов в устойчивые рабочие решения - ждём твоего отклика!