연구진이 MetaSyn 데이터셋을 공개했어요. 이 데이터셋은 Nature Portfolio 저널의 442개 메타 분석 논문으로 구성돼요. 12개 파이프라인 구성(RAG 변형 9개, 프로토콜 기반 에이전트 1개)을 테스트한 결과, 스크리닝 단계에서 성능 저하가 두드러졌어요. 현재 LLM은 관련성이 높은 PI/ECO-실격 연구를 식별하는 데 어려움을 겪고 있으며, 단계별 지표를 통해 시스템의 성공과 실패 지점을 파악해야 해요.