Вам предстоит:
Создание чат ботов (RAG подход), настройка моделей LLM, выполнение задач полного цикла от постановки задачи, до деплоя моделей.
Ключевые компетенции и требования:
1. Опыт работы с Large Language Models (LLM):
- Практический опыт работы с современными LLM (GPT, Llama, Mistral, Claude и др.).
- Понимание архитектуры, возможностей и ограничений различных моделей.
2. Реализация RAG (Retrieval-Augmented Generation):
- Опыт проектирования и оптимизации RAG-систем для улучшения генеративных моделей.
- Умение работать с векторными базами данных (Pinecone, Weaviate, FAISS, Chroma и др.).
- Навыки интеграции retrieval-механизмов с генеративными моделями.
3. Разработка и улучшение AI-ассистентов:
- Опыт создания чат-ботов, виртуальных ассистентов и диалоговых систем на основе LLM.
- Оптимизация качества ответов, управление контекстом диалога, снижение галлюцинаций.
- Работа с инструментами оценки качества ассистентов (человеческая оценка, автоматические метрики).
4. Fine-Tuning LLM:
- Опыт дообучения и адаптации LLM под специфические задачи (LoRA, QLoRA, полный fine-tuning).
- Умение работать с фреймворками для тонкой настройки (Hugging Face Transformers, PyTorch, TensorFlow).
- Понимание методов эффективного обучения (distillation, quantization, RLHF).
5. Программирование и инструменты:
- Свободное владение Python и библиотеками для ML (PyTorch, TensorFlow, Hugging Face).
- Опыт работы с API LLM (OpenAI, Anthropic, локальные модели через Ollama, vLLM и др.).
- Знание SQL и NoSQL для работы с данными.
6. Обработка данных и инженерия признаков:
- Навыки предобработки текстовых данных (токенизация, нормализация, augmentation).
- Опыт работы с датасетами для NLP (разметка, балансировка, аугментация).
7. MLOps и деплой моделей:
- Опыт развертывания LLM в production (FastAPI, Flask, Docker, Kubernetes).
- Знание методов мониторинга и обслуживания моделей (логирование, A/B-тестирование).
Желательные навыки (плюсы):
- Разговорный уровень английского языка
- Опыт работы с мультимодальными моделями (текст + изображение/аудио).
- Знание методов оптимизации LLM (квантзация, pruning, ускорение инференса).
- Опыт работы с фреймворками для RLHF (например, TRL от Hugging Face).
- Участие в open-source проектах или публикации в NLP/ML.
Мы предлагаем:
* Решение Министерства цифрового развития, связи и массовых коммуникаций РФ о предоставлении государственной аккредитации организации, осуществляющей деятельность в области информационных технологий от 10.03.2022 №АО-20220309-3771014210-3
Приходите в SimbirSoft за прокачкой хард-скиллов и интересными проектами!
Знаете кого-то, кто идеально сможет подойти? Расскажите им о нашей вакансии!
We are an Innovation hub based, which creates vibrant startup ecosystems and technologies for AdTech & MarTech projects.
Санкт-Петербург
Не указана
Интеллектуальные Системы Управления
Санкт-Петербург
Не указана
Университет ИТМО
Санкт-Петербург
от 120000 RUR
Санкт-Петербург
от 120000 RUR
Санкт-Петербург
от 120000 RUR
СПб ГКУ Санкт-Петербургский информационно-аналитический центр
Санкт-Петербург
от 120000 RUR
Санкт-Петербург
от 120000 RUR