ElevenLabs가 음성 에이전트 평가를 위한 6가지 핵심 지표를 제시했어요. TTS 음성 품질, 대화 품질, 도구 활용, 지능, 규정 준수 및 안전, 신뢰성 등이 주요 평가 항목이에요.
MOS 4.3, TSR 85% 초과, 첫 번째 오디오 시간 500ms 미만이 주요 목표이며, 산업별로 평가 항목의 중요도가 달라져요.
ElevenLabs는 WER 2.2%로 업계 최저, Turbo v2.5와 Flash v2.5는 속도 최고, ElevenAgents는 ~75ms 모델 추론 지연 시간을 제공하며, 다양한 모델 비교 분석 자료를 제공하고 있어요.