Composed Vision-Language Retrieval for Skin Cancer Case Search via Joint Alignment of Global and Local Representations
이 논문은 피부암 진단을 지원하기 위해 참조 이미지와 텍스트 설명을 결합한 복합 질의에 대해 전역 및 지역적 특징을 정렬하는 트랜스포머 기반 프레임워크를 제안하고, Derm7pt 데이터셋에서 기존 최첨단 방법보다 우수한 성능을 입증했습니다.