LLM-инженер

Описание вакансии

DUC Technologies – это быстроразвивающаяся консалтинговая компания в сфере IT, специализирующаяся на решениях в области управления данными, AI и прикладной Python-разработки.

Мы уже более 3 лет на рынке IT и за это время зарекомендовали себя как надежный партнер и работодатель.

Наша команда экспертов в сфере Big Data успешно работает в формате удаленного it-отдела. И будет рада принять тебя в теплую атмосферу нашей команды. Мы уважаем дисциплинированных, активных, ответственных и неординарных сотрудников.

Обязанности:

  • Разработка и настройка чат-ботов и ассистентов, включая реализацию цепочек вызовов, механизмов памяти и fallback.
  • Построение систем Retrieval-Augmented Generation (RAG): от разбиения данных на чанки до поиска релевантных результатов.
  • Оптимизация затрат на вызовы LLM, работа с механизмами streaming и function calling.
  • Интеграция API сторонних LLM (OpenAI, Claude, DeepSeek) и адаптация промптов под задачи.
  • Работа с векторными хранилищами (FAISS, Pinecone) и графами знаний.
  • Создание прототипов MVP интерфейсов для демонстрации функционала (HTMX/Bootstrap/Streamlit).
  • Настройка инфраструктуры для LLM: подключение API, конфигурирование кэшей и систем очередей.
  • Применение методов квантования моделей и организация fallback на локальные версии GPT.
  • Мониторинг ключевых метрик и ведение логов работы систем.
  • Работы с low code редакторами и настройка пайплайнов работы с LLM.

Требования:

  • Продвинутое владение Python: опыт работы с asyncio, threading, multiprocessing, профилированием задач, чувствительных к памяти/CPU.
  • Уверенное использование FastAPI в сочетании с Pydantic v2 для построения асинхронной архитектуры.
  • Опыт проектирования схем данных, настройки индексов и работы с СУБД: PostgreSQL, Redis, MongoDB.
  • Знание принципов контейнеризации: Docker, Docker Compose; базовое понимание Kubernetes.
  • Способность оперативно создавать рабочие MVP в сжатые сроки.
  • Умение самостоятельно определять задачи и подбирать оптимальные архитектурные решения.
  • Опыт взаимодействия с любыми API LLM

Будет плюсом:

  • Навыки быстрого прототипирования пользовательских интерфейсов (HTMX/Bootstrap/Streamlit).
  • Знания в области построения RAG-систем: выбор подходящих векторных БД и графов знаний.
  • Практический опыт настройки систем очередей сообщений: RabbitMQ, Kafka; работа с Celery — реализация retry-логики, dead-letter очередей.
  • Опыт работы с vLLM;
  • Опыт работы с провайдером ollama и библиотеками llamaindex, langchain, mcp, a2a;
  • Опыт разбиения на чанки и оптимизация точности LLM-моделей;
  • Опыт fine-tuning LLM моделей.
Условия:
  • ​​​​​​​​​​​​​​Удаленный формат работы;
  • Работа в аккредитованной IT компании;
  • Гибкий график работы 5/2, с 9.00- 18.00 или другой по согласованию (суббота, воскресенье и праздничные - выходные)
Навыки
  • API
  • OpenAI
  • Retrieval-Augmented Generation
  • RAG
  • Python
  • GPT
  • low code
Посмотреть контакты работодателя

Похожие вакансии

OSMI IT
Удаленная работа
  • Москва

  • от 150000 RUR

Рекомендуем

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию