СофтТелематика – российский разработчик интеллектуальных телематических систем и транспортно-логистических платформ.
Кого мы ищем:
Мы ищем Middle ML Developer / LLM Developer, который присоединится к нашей команде разработки интеллектуальных ассистентов и поисковых систем нового поколения. Основная задача – проектирование и внедрение production-решений на базе LLM и Retrieval-Augmented Generation (RAG), обеспечивающих точный поиск, обработку и генерацию знаний для корпоративных и отраслевых сценариев.
Нам нужен специалист, способный не только интегрировать существующие решения, но и разрабатывать собственные подходы для повышения качества поиска и ответов, включая настройку моделей, разработку пайплайнов и оптимизацию производительности. Вы будете работать на стыке современных языковых моделей, систем поиска и инженерии данных.
Основные задачи:
- Разработка и улучшение пайплайнов для RAG-сценариев (retrievers, embeddings, chunking, индексация)
- Настройка и оптимизация работы с LLM API / open-source LLM (например, Qwen, LLaMA, Mistral, GPT-OSS)
- Построение и обучение моделей для обработки текста (NER, классификация, ранжирование документов)
- Работа с векторными базами данных (Qdrant, FAISS).
- Исследование и внедрение новых методов, включая retrieval-fusion, hybrid search, tool-use
От будущего коллеги мы ждем:
- Опыт коммерческой разработки в ML от 3-х лет (опыт работы с LLM от 1-го года)
- Понимание основ современных языковых моделей и их ограничений для решения реальных задач
- Уверенное владение Python (NumPy, PyTorch/TensorFlow, HuggingFace, LangChain/LlamaIndex)
- Опыт построения production-пайплайнов (обработка данных, деплой моделей, мониторинг)
- Практический опыт с RAG или поисковыми системами (BM25, vector search, hybrid)
- Опыт работы с Docker, понимание CI/CD
Будет плюсом:
- Опыт тонкой донастройки LLM (LoRA, PEFT)
- Понимание требований к аппаратным ресурсам и производительности при обучении и инференсе LLM: умение оценить нагрузку на GPU/CPU/память, подобрать конфигурацию кластера, учитывать latency и throughput в продакшне
- Опыт оптимизации моделей для инференса (quantization, pruning, mixed precision)
- Опыт успешного вывода на рынок продукта на базе LLM
- Опыт работы с VLM моделями
Мы предлагаем:
- Конкурентную заработную плату (плюс бонус) – уровень дохода обсуждаем в зависимости от компетенций;
- Работу в аккредитованной ИТ-компании;
- Участие в инновационных сложных проектах, которыми можно гордиться;
- Расширенный пакет ДМС со стоматологией, нужную технику для работы, систему скидок для сотрудников;
- Насыщенную корпоративную жизнь: корпоративы, тимбилдинг, детские праздники, тематические дни, комьюнити, спортивные мероприятия;
- Комфортный офис с панорамными видами, местами для отдыха, развитой инфраструктурой: оборудованные кухни (кофе, фрукты, овощи, снеки в свободном доступе), вендинговые автоматы со здоровой едой, рядом с офисом кафе и рестораны в шаговой доступности;
- График работы: 5/2 с 9:00 до 18:00 (гибкое начало рабочего дня).