Вакансия ML Developer в городе Москва

Описание вакансии

СофтТелематика – российский разработчик интеллектуальных телематических систем и транспортно-логистических платформ.

Кого мы ищем:

Мы ищем Middle ML Developer / LLM Developer, который присоединится к нашей команде разработки интеллектуальных ассистентов и поисковых систем нового поколения. Основная задача – проектирование и внедрение production-решений на базе LLM и Retrieval-Augmented Generation (RAG), обеспечивающих точный поиск, обработку и генерацию знаний для корпоративных и отраслевых сценариев.

Нам нужен специалист, способный не только интегрировать существующие решения, но и разрабатывать собственные подходы для повышения качества поиска и ответов, включая настройку моделей, разработку пайплайнов и оптимизацию производительности. Вы будете работать на стыке современных языковых моделей, систем поиска и инженерии данных.

Основные задачи:

Разработка и улучшение пайплайнов для RAG-сценариев (retrievers, embeddings, chunking, индексация)
Настройка и оптимизация работы с LLM API / open-source LLM (например, Qwen, LLaMA, Mistral, GPT-OSS)
Построение и обучение моделей для обработки текста (NER, классификация, ранжирование документов)
Работа с векторными базами данных (Qdrant, FAISS).
Исследование и внедрение новых методов, включая retrieval-fusion, hybrid search, tool-use

От будущего коллеги мы ждем:

Опыт коммерческой разработки в ML от 3-х лет (опыт работы с LLM от 1-го года)
Понимание основ современных языковых моделей и их ограничений для решения реальных задач
Уверенное владение Python (NumPy, PyTorch/TensorFlow, HuggingFace, LangChain/LlamaIndex)
Опыт построения production-пайплайнов (обработка данных, деплой моделей, мониторинг)
Практический опыт с RAG или поисковыми системами (BM25, vector search, hybrid)
Опыт работы с Docker, понимание CI/CD

Будет плюсом:

Опыт тонкой донастройки LLM (LoRA, PEFT)
Понимание требований к аппаратным ресурсам и производительности при обучении и инференсе LLM: умение оценить нагрузку на GPU/CPU/память, подобрать конфигурацию кластера, учитывать latency и throughput в продакшне
Опыт оптимизации моделей для инференса (quantization, pruning, mixed precision)
Опыт успешного вывода на рынок продукта на базе LLM
Опыт работы с VLM моделями

Мы предлагаем:

Конкурентную заработную плату (плюс бонус) – уровень дохода обсуждаем в зависимости от компетенций;
Работу в аккредитованной ИТ-компании;
Участие в инновационных сложных проектах, которыми можно гордиться;
Расширенный пакет ДМС со стоматологией, нужную технику для работы, систему скидок для сотрудников;
Насыщенную корпоративную жизнь: корпоративы, тимбилдинг, детские праздники, тематические дни, комьюнити, спортивные мероприятия;
Комфортный офис с панорамными видами, местами для отдыха, развитой инфраструктурой: оборудованные кухни (кофе, фрукты, овощи, снеки в свободном доступе), вендинговые автоматы со здоровой едой, рядом с офисом кафе и рестораны в шаговой доступности;
График работы: 5/2 с 9:00 до 18:00 (гибкое начало рабочего дня).

Навыки

Python
PyTorch
ML
Docker

Посмотреть контакты работодателя

Адрес

Зарплата
Не указана
Занятость
Полная занятость, Полный день
Опыт работы
От 3 до 6 лет
Дата размещения:
08.10.2025 05:17:09

ML Developer

ML Developer

Описание вакансии

Навыки

Адрес

Краткое описание вакансии

Зарплата

Занятость

Опыт работы

Дата размещения:

Похожие вакансии

Хотите оставить вакансию?