MTPLX는 Apple Silicon MacBook Pro에서 Qwen3.6-27B 모델의 추론 속도를 최대 2.25배까지 향상시키는 새로운 도구입니다. 이 도구는 모델의 내장 MTP 헤드를 활용하여 코딩 및 창작 작업에 적합합니다.
MTPLX는 기존의 DFlash나 DDTree와 달리 수학적으로 정확한 온도 샘플링 방식을 사용하며, 사용자가 MTP 헤드의 깊이를 자유롭게 설정할 수 있습니다.
MTPLX는 OpenAI 및 Anthropic API와 호환되는 서버, 브라우저 채팅 UI, 터미널 채팅 기능을 제공하며, 사용자는 로컬 에디터에서 바로 사용할 수 있습니다.