Разработка и доработка LLM: Проектирование, создание и адаптация больших языковых моделей для решения специфических задач компании.
Оптимизация моделей: Улучшение производительности и эффективности использования LLM и других ML-моделей на серверном оборудовании (включая работу с k8s).
Исследование и внедрение: Изучение новых архитектур моделей, методов их тренировки (например, LoRA, QLoRA) и интеграция передовых подходов.
Работа с ML-инфраструктурой: Применение RAG (Retrieval-Augmented Generation), векторных баз данных и эмбеддинг-моделей для создания продвинутых ИИ-решений.
Разработка ИИ-решений: Создание кастомных AI-решений для оптимизации производственных процессов и других направлений бизнеса.
Требования:
Образование: Высшее техническое или в области ИТ.
Опыт работы: От 3 до 5 лет в области машинного обучения, разработки LLM или смежных направлений.
ML-фреймворки: Уверенное владение PyTorch и/или TensorFlow.
LLM-инструменты: Опыт работы с библиотеками для LLM, такими как Langchain, Llama.
Глубокие знания Python и опыт разработки на нем.
ML-практики: Опыт работы с RAG, векторными базами данных, эмбеддинг-моделями.
Знание техник дообучения и оптимизации моделей (LoRA, QLoRA).
Опыт работы с Kubernetes (k8s) и опыт развертывания ML-моделей.
Свободное владение Linux и командной строкой.
Условия:
Удалённый формат работы
Официальное оформление по ТкРФ, белая ЗП (по договорённости);
График работы 5/2 с 8:30 до 17:30 по Москве;
Премии за эффективную работу и достижение результатов;
Различные программы обучения для прокачки профессиональных скиллов;