Тбилиси
Опыт работы с выкаткой в прод моделей LLM, TTS, STT и другими моделями машинного обучения. Знание инструментов для управления данными...
ML Production: - оптимизация моделей: : квантизация (LLM: AWQ, GPTQ, BnB, GGUF и др., vllm compressor), дистилляция, прунинг. - оптимизация инференса: speculative decoding...