Visually-Guided Controllable Medical Image Generation via Fine-Grained Semantic Disentanglement
이 논문은 복잡한 시각적 세부 사항과 추상적인 임상 텍스트 간의 모달리티 격차와 의미적 얽힘 문제를 해결하기 위해, 시각적 사전 지식을 활용한 교차 모드 잠재 정렬 메커니즘과 하이브리드 특징 융합 모듈을 통해 의료 이미지의 미세한 구조적 제어를 가능하게 하는 '시각 유도형 텍스트 해리 (Visually-Guided Text Disentanglement)' 프레임워크를 제안합니다.