How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices

이 논문은 생성 기반 이미지 복원 기술의 실제 능력을 평가하기 위해 새로운 다차원 평가 체계를 제안하고, 기존 방법 대비 성능 격차와 '세부 정보 부족'에서 '과잉 생성 및 의미적 제어'로 전환된 새로운 실패 양상을 규명하며, 인간 지각과 부합하는 새로운 이미지 품질 평가 모델을 개발함으로써 해당 분야의 발전 방향을 제시합니다.

Xiang Yin, Jinfan Hu, Zhiyuan You + 4 more2026-03-06💻 cs

Tell2Adapt: A Unified Framework for Source Free Unsupervised Domain Adaptation via Vision Foundation Model

이 논문은 비전 기반 모델 (VFM) 의 일반화된 지식을 활용하여 다양한 임상 환경에서의 소스 프리 비지도 도메인 적응 문제를 해결하기 위해 제안된 Tell2Adapt 프레임워크를 소개하며, 맥락 인식 프롬프트 정규화와 시각적 타당성 정제 기법을 통해 의료 영상 분할 분야에서 기존 방법론을 능가하는 성능을 입증했습니다.

Yulong Shi, Shijie Li, Ziyi Li + 1 more2026-03-06💻 cs

Exploiting Intermediate Reconstructions in Optical Coherence Tomography for Test-Time Adaption of Medical Image Segmentation

이 논문은 저비용 의료 영상 장비에서 생성된 광간섭 단층촬영 (OCT) 의 중간 재구성 정보를 활용하여, 재구성 과정의 시간적 스케일에 기반한 모듈러 네트워크를 통해 테스트 시간에 하위 분할 모델의 정규화 계수를 적응시킴으로써 분할 성능을 향상시키고 불확실성을 추정하는 IRTTA 방법을 제안합니다.

Thomas Pinetz, Veit Hucke, Hrvoje Bogunovic2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

이 논문은 다양한 카메라 구성에서 발생하는 공간적 사전 지식의 불일치를 해결하기 위해 공간 인식 특징 변조 (SFM) 와 카메라 인식 데이터 증강 (CDA) 을 도입하여 새로운 플랫폼으로의 일반화 성능을 획기적으로 향상시킨 범용 다중 카메라 3D 객체 감지 프레임워크인 CoIn3D 를 제안합니다.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs

MI-DETR: A Strong Baseline for Moving Infrared Small Target Detection with Bio-Inspired Motion Integration

이 논문은 복잡한 배경 속에서 움직이는 적외선 소표적을 탐지하기 위해 생체 영감을 받아 움직임과 외관을 통합하는 새로운 강력한 베이스라인 모델인 MI-DETR 을 제안하고, 이를 통해 여러 벤치마크에서 기존 최첨단 방법보다 우수한 성능을 달성했음을 보여줍니다.

Nian Liu, Jin Gao, Shubo Lin + 8 more2026-03-06💻 cs

UniM: A Unified Any-to-Any Interleaved Multimodal Benchmark

이 논문은 텍스트, 이미지, 오디오 등 7 가지 모달리티가 임의로 교차된 입력을 이해하고 생성하는 'Any-to-Any' 능력을 평가하기 위해 31,000 개의 고품질 데이터셋인 UniM 벤치마크와 평가 체계를 소개하고, 이를 위한 UniMA 기반 모델을 제안하여 통합된 멀티모달 지능의 발전 방향을 제시합니다.

Yanlin Li, Minghui Guo, Kaiwen Zhang + 13 more2026-03-06💻 cs

GEM-TFL: Bridging Weak and Full Supervision for Forgery Localization through EM-Guided Decomposition and Temporal Refinement

이 논문은 이진 비디오 레벨 라벨만 사용하는 약한 지도 학습의 한계를 극복하기 위해 EM 기반 최적화, 학습 불필요한 시간적 일관성 정제, 그리고 제안 간 관계를 모델링하는 그래프 기반 정제 모듈을 도입하여 GEM-TFL 을 제안하고, 완전 지도 학습 방법과 유사한 성능으로 비디오 내 조작 구간을 정확하게 국소화하는 것을 목표로 합니다.

Xiaodong Zhu, Yuanming Zheng, Suting Wang + 4 more2026-03-06🤖 cs.AI