연구진이 3D 공간 제어를 위한 새로운 프레임워크 'LooseControlVideo'를 발표했어요. 이 프레임워크는 사용자가 3D 박스를 활용해 장면의 레이아웃과 움직임을 직관적으로 제어할 수 있도록 설계됐어요.
LooseControlVideo는 기존 모델보다 적은 정보로도 복잡한 장면의 움직임과 상호작용을 생성할 수 있으며, 누Scenes, HO-3D, BEHAVE 벤치마크에서 기존 방식보다 우수한 성능을 보였어요.
새로운 인코딩 방식인 DNOCS를 활용해 3D 크기, 방향, 깊이 순서의 폐색 정보를 학습했으며, 기존 모델 대비 트래저토리 오류는 1.2~3배, 강체 운동 일관성은 2배, 폐색 정확도는 1.5~2배 향상됐어요.