Pulse · AI 뉴스

필요할 때만 생각: 적응적 추론 기반 다중 모드 임베딩, 이중 LoRA 아키텍처

TWN · 2026-05-14

연구진은 불필요한 추론을 줄이고 성능을 향상시키는 'Think When Needed (TWN)'라는 새로운 다중 모드 임베딩 프레임워크를 제안했습니다.

TWN은 이중 LoRA 아키텍처를 사용하여 추론 및 임베딩 어댑터를 공유된 백본에 연결하고, 입력에 따라 추론 여부를 결정하는 적응적 추론 메커니즘을 도입합니다.

MMEB-V2 78개 작업에서 TWN은 기존 생성 방식보다 뛰어난 임베딩 품질을 달성하면서도 파라미터와 추론 토큰 수를 크게 줄였습니다.

##멀티모달##임베딩##LoRA
매일 핵심 AI 소식을 한국어로, 빠르게
App Store 에서 Pulse 받기 앱에서 열기