연구진은 픽셀 공간 확산 모델이 전체 대역폭의 노이즈 이미지로 학습되지만, 디노이징에 유용한 신호는 주파수 의존적이라는 점에 주목했어요.
데이터-노이즈 경계는 각 시간 t에서 저주파 영역과 고주파 영역을 분리하며, 스펙트럴 포싱을 통해 이 구조를 명시화했어요.
ImageNet-256에서 스펙트럴 포싱은 FID 및 Inception Score를 개선했으며, SenseNova-U1에 통합되어 DPG-Bench 및 GenEval을 향상시켰어요.
연구 결과는 용량 효율적인 픽셀 공간 확산을 위한 경로를 제시하며, 신호를 보여주고 노이즈를 숨기는 방법을 보여줘요.