ML Developer

Концерн Телематика

ML Developer

Москва, Огородный проезд, 16/1с4

Метро: Бутырская

Описание вакансии

СофтТелематика – российский разработчик интеллектуальных телематических систем и транспортно-логистических платформ.

Кого мы ищем:

Мы ищем Middle ML Developer / LLM Developer, который присоединится к нашей команде разработки интеллектуальных ассистентов и поисковых систем нового поколения. Основная задача – проектирование и внедрение production-решений на базе LLM и Retrieval-Augmented Generation (RAG), обеспечивающих точный поиск, обработку и генерацию знаний для корпоративных и отраслевых сценариев.

Нам нужен специалист, способный не только интегрировать существующие решения, но и разрабатывать собственные подходы для повышения качества поиска и ответов, включая настройку моделей, разработку пайплайнов и оптимизацию производительности. Вы будете работать на стыке современных языковых моделей, систем поиска и инженерии данных.

Основные задачи:

  • Разработка и улучшение пайплайнов для RAG-сценариев (retrievers, embeddings, chunking, индексация)
  • Настройка и оптимизация работы с LLM API / open-source LLM (например, Qwen, LLaMA, Mistral, GPT-OSS)
  • Построение и обучение моделей для обработки текста (NER, классификация, ранжирование документов)
  • Работа с векторными базами данных (Qdrant, FAISS).
  • Исследование и внедрение новых методов, включая retrieval-fusion, hybrid search, tool-use

От будущего коллеги мы ждем:

  • Опыт коммерческой разработки в ML от 3-х лет (опыт работы с LLM от 1-го года)
  • Понимание основ современных языковых моделей и их ограничений для решения реальных задач
  • Уверенное владение Python (NumPy, PyTorch/TensorFlow, HuggingFace, LangChain/LlamaIndex)
  • Опыт построения production-пайплайнов (обработка данных, деплой моделей, мониторинг)
  • Практический опыт с RAG или поисковыми системами (BM25, vector search, hybrid)
  • Опыт работы с Docker, понимание CI/CD

Будет плюсом:

  • Опыт тонкой донастройки LLM (LoRA, PEFT)
  • Понимание требований к аппаратным ресурсам и производительности при обучении и инференсе LLM: умение оценить нагрузку на GPU/CPU/память, подобрать конфигурацию кластера, учитывать latency и throughput в продакшне
  • Опыт оптимизации моделей для инференса (quantization, pruning, mixed precision)
  • Опыт успешного вывода на рынок продукта на базе LLM
  • Опыт работы с VLM моделями

Мы предлагаем:

  • Конкурентную заработную плату (плюс бонус) – уровень дохода обсуждаем в зависимости от компетенций;
  • Работу в аккредитованной ИТ-компании;
  • Участие в инновационных сложных проектах, которыми можно гордиться;
  • Расширенный пакет ДМС со стоматологией, нужную технику для работы, систему скидок для сотрудников;
  • Насыщенную корпоративную жизнь: корпоративы, тимбилдинг, детские праздники, тематические дни, комьюнити, спортивные мероприятия;
  • Комфортный офис с панорамными видами, местами для отдыха, развитой инфраструктурой: оборудованные кухни (кофе, фрукты, овощи, снеки в свободном доступе), вендинговые автоматы со здоровой едой, рядом с офисом кафе и рестораны в шаговой доступности;
  • График работы: 5/2 с 9:00 до 18:00 (гибкое начало рабочего дня).
Навыки
  • Python
  • PyTorch
  • ML
  • Docker
Посмотреть контакты работодателя

Адрес

Похожие вакансии

Хотите оставить вакансию?

Заполните форму и найдите сотрудника всего за несколько минут.
Оставить вакансию