RAFM: Retrieval-Augmented Flow Matching for Unpaired CBCT-to-CT Translation

이 논문은 소규모 의료 데이터셋에서 비쌍합 CBCT-to-CT 변환의 불안정성을 해결하기 위해 DINOv3 인코더와 글로벌 CT 메모리 뱅크를 활용한 검색 기반 가짜 쌍 (retrieval-guided pseudo pairs) 구성 전략을 도입한 '검색 증강 흐름 매칭 (RAFM)'을 제안하고, SynthRAD2023 벤치마크에서 기존 방법들을 능가하는 성능을 입증했습니다.

Xianhao Zhou, Jianghao Wu, Lanfeng Zhong + 4 more2026-03-03💻 cs

Multiple Inputs and Mixwd data for Alzheimer's Disease Classification Based on 3D Vision Transformer

이 논문은 3D 비전 트랜스포머를 활용하여 연속적인 MRI 슬라이스, 다중 관심 영역, 그리고 인구통계학적 및 인지 평가 데이터를 통합하는 'MIMD-3DVT'라는 새로운 방법을 제안함으로써 알츠하이머병 진단 정확도를 97.14%까지 향상시켰음을 보여줍니다.

Juan A. Castro-Silva, Maria N. Moreno Garcia, Diego H. Peluffo-Ordoñez2026-03-03💻 cs

Weakly Supervised Video Anomaly Detection with Anomaly-Connected Components and Intention Reasoning

이 논문은 약한 감독 비디오 이상 탐지 (WS-VAD) 의 한계를 극복하기 위해 이상 연결 성분 메커니즘과 의도 인식 전략을 결합하고 이상 속성 정보를 활용하여 프레임별 의미 정보를 효과적으로 학습하는 새로운 프레임워크 'LAS-VAD'를 제안하고, XD-Violence 와 UCF-Crime 데이터셋에서 기존 최첨단 방법들을 능가하는 성능을 입증합니다.

Yu Wang, Shengjie Zhao2026-03-03💻 cs

MIDAS: Multi-Image Dispersion and Semantic Reconstruction for Jailbreaking MLLMs

이 논문은 단일 이미지의 제약을 넘어 여러 이미지에 해로운 의미를 분산 배치하고 시각적 단서를 활용한 추론을 통해 MLLM 의 안전 장치를 우회하는 새로운 자일브레이크 프레임워크 'MIDAS'를 제안하며, 실험을 통해 폐쇄형 상용 모델에서 평균 81.46% 의 높은 공격 성공률을 입증했습니다.

Yilian Liu, Xiaojun Jia, Guoshun Nan + 6 more2026-03-03🤖 cs.AI

Data-Centric Benchmark for Label Noise Estimation and Ranking in Remote Sensing Image Segmentation

이 논문은 원격 탐사 이미지 분할에서 레이블 노이즈를 식별하고 정량화하며 순위 매기기 위한 새로운 데이터 중심 벤치마크, 공개 데이터셋, 그리고 모델 불확실성과 예측 일관성 등을 활용한 두 가지 기법을 제안하여 기존 베이스라인을 능가하는 성능을 입증합니다.

Keiller Nogueira, Codrut-Andrei Diaconu, Dávid Kerekes + 9 more2026-03-03💻 cs

Linking Modality Isolation in Heterogeneous Collaborative Perception

이 논문은 이질적인 협업 지각에서 모달리티 격리를 해결하기 위해 공간적 중첩 없이도 다양한 모달리티 간의 특징을 정렬하는 새로운 프레임워크인 CodeAlign 을 제안하며, OPV2V 와 DAIR-V2X 데이터셋에서 기존 방법보다 훨씬 적은 파라미터와 통신 부하로 최첨단 성능을 달성함을 보여줍니다.

Changxing Liu, Zichen Chao, Siheng Chen2026-03-03💻 cs

Exploring Spatiotemporal Feature Propagation for Video-Level Compressive Spectral Reconstruction: Dataset, Model and Benchmark

이 논문은 동적 초분광 영상 재구성을 위해 최초의 고화질 동적 데이터셋 (DynaSpec) 과 시공간 특징 전파를 활용한 효율적인 트랜스포머 모델 (PG-SVRT) 을 제안하고, 이를 통해 기존 이미지 기반 방법의 한계를 극복하여 재구성 품질과 시간적 일관성을 동시에 향상시켰음을 보여줍니다.

Lijing Cai, Zhan Shi, Chenglong Huang + 6 more2026-03-03💻 cs

Stateful Cross-layer Vision Modulation

이 논문은 기존 멀티모달 모델의 시각적 특징 융합 한계를 극복하기 위해, 재귀적 메모리 상태와 피드백 조절 메커니즘을 통해 시각 표현의 진화 경로를 구조적으로 제어하는 'SCVM' 프레임워크를 제안하며, 언어 모델을 수정하거나 추가 학습 없이도 다양한 벤치마크에서 일관된 성능 향상을 달성함을 보여줍니다.

Ying Liu, Yudong Han, Kean Shi + 1 more2026-03-03💻 cs

Act Like a Pathologist: Tissue-Aware Whole Slide Image Reasoning

이 논문은 병리학자가 슬라이드를 분석할 때 보이는 조직을 먼저 파악한 후 세부 영역을 선택적으로 확대하는 인간의 방식을 모방하여, 질문 기반의 조직 인식 및 coarse-to-fine 검색 프레임워크인 HistoSelect 를 제안함으로써 전체 슬라이드 이미지 기반의 병리학 질문 응답 정확도를 높이고 시각 토큰 사용량을 대폭 줄인다고 요약할 수 있습니다.

Wentao Huang, Weimin Lyu, Peiliang Lou + 8 more2026-03-03💻 cs