Nomadoor가 FLUX.2 Klein 모델 기반의 깊이, 노멀, 포즈, 세그멘테이션 LoRA를 공개했어요. 기존 이미지 편집 모델을 활용한 CV(컴퓨터 비전) 연구의 일환입니다. 결과는 완벽하지 않지만, amodal 세그멘테이션과 같이 예상했던 결과가 일부 관찰됐어요.
상대적인 깊이와 노멀은 비교적 잘 작동했지만, 포즈 추정은 세부적으로 문제가 발생했고, 세그멘테이션은 불안정했어요. amodal 세그멘테이션은 모델이 보이지 않는 영역을 추론해야 하므로 생성적 작업에 가깝습니다.
연구자는 이미지 편집 모델의 유용성이 '이미지 편집'으로 정의하는 범위에 따라 크게 달라질 수 있다고 생각하며, 새로운 표현 방식이 나올 가능성에 주목하고 있어요. 연구 결과는 Hugging Face에서 확인할 수 있습니다.