Location-Aware Pretraining for Medical Difference Visual Question Answering

이 논문은 방사선과 전문의의 비교 진단 워크플로우를 모방하여 질병 진행과 촬영 차이로 인한 미세한 시각적 변이를 구별하기 위해 자동 참조 표현 및 지상화 캡션링과 같은 위치 인식 태스크를 포함한 사전 학습 프레임워크를 제안함으로써, 흉부 X-ray 이미지에서 임상적으로 관련 있는 변화를 감지하고 추론하는 성능을 획기적으로 개선한 연구입니다.

Denis Musinguzi, Caren Han, Prasenjit Mitra2026-03-06🤖 cs.AI

BiEvLight: Bi-level Learning of Task-Aware Event Refinement for Low-Light Image Enhancement

이 논문은 저조도 이미지 향상 (LLIE) 시 이벤트 카메라의 내재적 노이즈와 이미지 신호 대 잡음비 저하로 인한 성능 병목 현상을 해결하기 위해, 이미지와 이벤트 간의 강한 기울기 상관관계를 활용한 경향성 기반 이벤트 정제 사전 지식을 도입하고, 향상 작업에 적응적으로 최적화되도록 이벤트 정제를 상하위 레벨 최적화 문제로 재정의한 'BiEvLight' 프레임워크를 제안합니다.

Zishu Yao, Xiang-Xiang Su, Shengning Zhou + 3 more2026-03-06💻 cs

Think, Then Verify: A Hypothesis-Verification Multi-Agent Framework for Long Video Understanding

이 논문은 장기간 비디오 이해의 어려움을 해결하기 위해, 답변 후보를 검증 가능한 가설로 재구성하고 국소적 비디오 콘텐츠를 통해 이를 검증하는 'VideoHV-Agent'라는 다중 에이전트 프레임워크를 제안하여 기존 방법론보다 높은 정확도와 논리적 타당성을 달성했다고 요약할 수 있습니다.

Zheng Wang, Haoran Chen, Haoxuan Qin + 3 more2026-03-06💻 cs

Physics-consistent deep learning for blind aberration recovery in mobile optics

이 논문은 단일 흐릿한 이미지에서 물리적으로 일관된 Zernike 계수, 파면 및 점확산함수 제약을 통합한 'Lens2Zernike' 프레임워크를 제안하여 모바일 광학의 왜곡을 물리적으로 정확하게 복원하고 이를 통해 안정적인 비블라인드 디컨볼루션을 가능하게 함으로써 기존 딥러닝 및 고전적 방법보다 우수한 성능을 달성했습니다.

Kartik Jhawar, Tamo Sancho Miguel Tandoc, Khoo Jun Xuan + 1 more2026-03-06💻 cs

How far have we gone in Generative Image Restoration? A study on its capability, limitations and evaluation practices

이 논문은 생성 기반 이미지 복원 기술의 실제 능력을 평가하기 위해 새로운 다차원 평가 체계를 제안하고, 기존 방법 대비 성능 격차와 '세부 정보 부족'에서 '과잉 생성 및 의미적 제어'로 전환된 새로운 실패 양상을 규명하며, 인간 지각과 부합하는 새로운 이미지 품질 평가 모델을 개발함으로써 해당 분야의 발전 방향을 제시합니다.

Xiang Yin, Jinfan Hu, Zhiyuan You + 4 more2026-03-06💻 cs

Tell2Adapt: A Unified Framework for Source Free Unsupervised Domain Adaptation via Vision Foundation Model

이 논문은 비전 기반 모델 (VFM) 의 일반화된 지식을 활용하여 다양한 임상 환경에서의 소스 프리 비지도 도메인 적응 문제를 해결하기 위해 제안된 Tell2Adapt 프레임워크를 소개하며, 맥락 인식 프롬프트 정규화와 시각적 타당성 정제 기법을 통해 의료 영상 분할 분야에서 기존 방법론을 능가하는 성능을 입증했습니다.

Yulong Shi, Shijie Li, Ziyi Li + 1 more2026-03-06💻 cs

Exploiting Intermediate Reconstructions in Optical Coherence Tomography for Test-Time Adaption of Medical Image Segmentation

이 논문은 저비용 의료 영상 장비에서 생성된 광간섭 단층촬영 (OCT) 의 중간 재구성 정보를 활용하여, 재구성 과정의 시간적 스케일에 기반한 모듈러 네트워크를 통해 테스트 시간에 하위 분할 모델의 정규화 계수를 적응시킴으로써 분할 성능을 향상시키고 불확실성을 추정하는 IRTTA 방법을 제안합니다.

Thomas Pinetz, Veit Hucke, Hrvoje Bogunovic2026-03-06💻 cs

CoIn3D: Revisiting Configuration-Invariant Multi-Camera 3D Object Detection

이 논문은 다양한 카메라 구성에서 발생하는 공간적 사전 지식의 불일치를 해결하기 위해 공간 인식 특징 변조 (SFM) 와 카메라 인식 데이터 증강 (CDA) 을 도입하여 새로운 플랫폼으로의 일반화 성능을 획기적으로 향상시킨 범용 다중 카메라 3D 객체 감지 프레임워크인 CoIn3D 를 제안합니다.

Zhaonian Kuang, Rui Ding, Haotian Wang + 3 more2026-03-06💻 cs