EditPropBench는 LLM 편집기가 사실 수정으로 인한 의존성 있는 논문 주장을 얼마나 잘 전파하는지 측정하는 벤치마크입니다.
벤치마크는 합성 논문, 대상 수정, 문장 수준의 의존성 레이블이 있는 제어된 사실 그래프를 포함하며, ERA(Edit-Ripple Adherence)를 중심으로 하는 측정 세트를 제공합니다.
현재 LLM 편집기는 많은 잠재적 결과를 수정할 수 있지만, 신뢰할 수 있는 과학적 수정에는 여전히 의존성 인지 확인이 필요합니다.