Llama.cpp를 최근에 업데이트하지 않은 경우 MTP 성능 저하를 경험할 수 있습니다. 사용자들은 Llama.cpp를 업데이트한 후 토큰 처리 속도가 1.5~1.8배 향상됐다고 보고했어요. pp 문제도 대부분 해결돼 사용자 경험이 개선됐습니다.
MTP (Mixture of Experts)는 여러 모델을 결합해 사용하는 기술로, Llama.cpp 최신 버전에서 성능이 최적화됐습니다. 이전 버전에서는 성능 저하 문제가 있었지만, 업데이트를 통해 개선됐습니다.
사용자는 Llama.cpp 업데이트 후 토큰 처리 속도 향상과 함께 pp 문제 해결을 경험하며 긍정적인 평가를 남겼습니다. Llama.cpp 사용자라면 최신 버전으로 업데이트하는 것을 권장합니다.