ML-инженер/ML Engineer

Чекашкин Александр Валерьевич

ML-инженер/ML Engineer

Москва, 2-я Брестская улица, 39с4

Метро: Белорусская

Описание вакансии

О компании

ServerFlow — компания, специализирующаяся на продаже и интеграции серверного оборудования. В частности, мы работаем с современными GPU-платформами, создавая высокопроизводительные решения для бизнеса и науки в сфере искусственного интеллекта.


Сегодня рынок резко смещается в сторону AI-инфраструктуры, и спрос на локальное внедрение моделей ИИ растёт. Мы запускаем новое направление — развёртывание и оптимизация open-source-моделей на наших серверах. Для этого нам нужен ML-инженер, который поможет соединить вычислительное «железо» и реальные AI-решения.

Задачи

  • Развёртывание open-source-моделей (DeepSeek, LLaMA, Qwen, Mistral, Gemma, Stable Diffusion и др.) на серверном оборудовании компании.

  • Проектирование архитектуры развёртывания — от выбора дистрибутива Linux до настройки движков инференса (vLLM, SGLang, Llama-cpp, TensorRT-LLM и др.).

  • Подбор оптимальной конфигурации под конкретные модели: GPU, CPU, память, накопители и др..

  • Интеграция RAG-систем (Retrieval-Augmented Generation): LangChain, LlamaIndex, RAGFlow, GraphRAG, Agentic RAG и др.

  • Настройка пайплайнов, квантизации (FP16, FP8, INT4, Q4_K_M и др.), а также базовых параметров нейронок для инференса и fine-tuning.

  • Подготовка и дообучение моделей (LoRA, QLoRA, PEFT), настройка форматов весов (safetensors, GGUF, bin, pt и др.).

  • Работа с backend-ами и фреймворками: PyTorch, TensorFlow, ONNX Runtimee.

  • При необходимости — автоматизация рутинных задач на Python (скрипты, пайплайны, API-обвязки).

Требования

  • Опыт развёртывания или сопровождения open-source-LLM (DeepSeek, LLaMA, Mistral, Qwen и др.).

  • Понимание принципов работы трансформеров и диффузионных сетей.

  • Уверенное владение Linux (Ubuntu/Debian или RHEL подобные дистрибутивы).

  • Знание основ Docker, venv, conda, систем версионирования.

  • Базовые навыки Python (автоматизация, API, bash-скрипты).

  • Желательно — понимание RAG-архитектуры и инструментов (LangChain, LlamaIndex, RAGFlow).

  • Будет плюсом: опыт fine-tuning, знание форматов хранения весов, участие в проектах Hugging Face.

  • Если вы внимательно прочитали анкету, напишите слово "Gemma" в сопроводительном, так мы поймем, насколько вы погрузились :)

Мы предлагаем

  • Работа с современной AI-инфраструктурой и GPU-серверами.
  • Возможность строить с нуля направление AI-интеграции внутри компании.
  • Свобода выбора технологий и инструментов.
  • Доступ к современному железу, open-source-моделям и тестовым стендам.
  • Перспектива вырасти в технического лида направления AI-инфраструктуры.
  • Бонусы, премии за успешную, эффективную работу.
  • График работы 5/2 с 10-19 часов. Полная занятость. Отпуск 28 календарных дней.
  • Офис находится в 5 минутах пешком от ст. м. Белорусская.

Приятные бонусы:

В 5 минутной доступности от офиса имеются всевозможные кафе и магазины.

  • В офисе имеется безлимитный кофе, чай и базовые снеки.
  • Возможность обучаться у ведущих специалистов по AI инфраструктуре, GPU серверным решениям и системам виртуализации.
  • Если дочитали до этого места, вы точно не просто кликаете по вакансиям 😊. При отклике напишите кодовое слово «xeon». Так мы поймём, что вы действительно хотите у нас работать и знаете, зачем пришли в ServerFlow.
Навыки
  • Linux
  • Machine Learning
  • Python
  • PyTorch
  • Qwen
  • Gemma
  • LLama
  • Инференс
  • Квантизация
  • Kubernetes
  • Обучение нейросетей
  • Ai
  • искусственный интеллект
  • ИИ
  • Docker
  • Ubuntu
  • TensorFlow
  • Debian
Посмотреть контакты работодателя

Адрес

Похожие вакансии

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Prompt Engineer (Python)

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • Не указана

Рекомендуем
Корпорация Галактика

ML-инженер

Корпорация Галактика

Полный день
  • Москва

  • Не указана

Рекомендуем
IT Solutions Management International Pte. Ltd.

ML Engineer

IT Solutions Management International Pte. Ltd.

Удаленная работа
  • Москва

  • до 117000 RUR

Рекомендуем
Удаленная работа
  • Москва

  • до 117000 RUR

AdSensor
Удаленная работа
  • Москва

  • до 117000 RUR

Полный день
  • Москва

  • до 117000 RUR

Национальное Бюро Информатизации

Алгоритмист - разработчик (Applied ML)

Национальное Бюро Информатизации

Полный день
  • Москва

  • до 117000 RUR

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

ML/LLM Engineer

ТЕХНОЛОГИИ ОТРАСЛЕВОЙ ТРАНСФОРМАЦИИ

Полный день
  • Москва

  • до 117000 RUR

СБЕР
Полный день
  • Москва

  • до 117000 RUR

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Middle NLP инженер

Отраслевой центр разработки и внедрения информационных систем / ОЦРВ

Удаленная работа
  • Москва

  • до 117000 RUR

ML-engineer

Платформа Трим

Полный день
  • Москва

  • до 117000 RUR

Риверстарт
Удаленная работа
  • Москва

  • до 350000 RUR

Операционное совершенство

Data Scientist / ML Engineer (Middle)

Операционное совершенство

Полный день
  • Москва

  • до 350000 RUR

СБЕР
Полный день
  • Москва

  • до 350000 RUR

X5 Tech
Полный день
  • Москва

  • до 350000 RUR

VK
Удаленная работа
  • Москва

  • до 350000 RUR

Инвестиционный дом D8
Полный день
  • Москва

  • до 350000 RUR

Диджитал Лайн

AI Engineer

Диджитал Лайн

Удаленная работа
  • Москва

  • до 350000 RUR

Яндекс

ML-инженер

Яндекс

Полный день
  • Москва

  • до 350000 RUR

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию