StepFun이 Strix Halo APU에서 Step-3.7-Flash 모델의 MTP 벤치마크 결과를 공개했어요. MTP는 사전 처리 속도에는 영향을 주지 않으면서 토큰 생성 속도를 27.5% 향상시켰어요.
MTP를 사용했을 때 1150-in/2000-out 테스트에서 20.8% 더 빠른 속도를 보였으며, 두 슬롯에서 동시에 사용할 때 전체 속도는 5% 향상됐어요.
StepFun MTP는 200B 파라미터 모델에서 단일 스트림으로 26토큰/초의 속도를 제공하며, 이는 Qwen 122B MTP와 비슷한 수준이에요.