Learning Latent Transmission and Glare Maps for Lens Veiling Glare Removal

이 논문은 스테이블 디퓨전 기반의 사전 지식을 활용해 렌즈 베일링 글레어의 전파 및 글레어 맵을 비지도 방식으로 학습하는 생성 모델 'VeilGen'과 이를 활용한 복원 네트워크 'DeVeiler'를 제안하여, 기존 시뮬레이션의 한계를 극복하고 단순화된 광학 시스템에서 우수한 복원 품질과 물리적 충실도를 달성함을 보여줍니다.

Xiaolong Qian, Qi Jiang, Lei Sun, Zongxi Yu, Kailun Yang, Peixuan Wu, Jiacheng Zhou, Yao Gao, Yaoguang Ma, Ming-Hsuan Yang, Kaiwei Wang2026-03-09🔬 physics.optics

EgoCogNav: Cognition-aware Human Egocentric Navigation

이 논문은 인간의 인지적 요인을 고려한 새로운 다중 모달 내비게이션 프레임워크 'EgoCogNav'와 실제 세계 데이터셋 'CEN'을 제안하여, 인간의 내비게이션 행동과 관련된 지각된 불확실성을 예측하고 이를 통해 인간과 유사한 행동 패턴을 학습하는 것을 목표로 합니다.

Zhiwen Qiu, Ziang Liu, Wenqian Niu, Tapomayukh Bhattacharjee, Saleh Kalantari2026-03-09🤖 cs.LG

SyncMV4D: Synchronized Multi-view Joint Diffusion of Appearance and Motion for Hand-Object Interaction Synthesis

이 논문은 2D 외관과 4D 동역학을 밀접하게 결합하여 단일 뷰의 한계를 극복하고, 시각적 사실성과 운동의 타당성, 다중 뷰 일관성을 모두 갖춘 손 - 물체 상호작용 (HOI) 을 생성하는 최초의 동기화된 다중 뷰 4D 생성 모델인 'SyncMV4D'를 제안합니다.

Lingwei Dang, Zonghan Li, Juntong Li, Hongwen Zhang, Liang An, Yebin Liu, Qingyao Wu2026-03-09💻 cs

UniTS: Unified Spatio-Temporal Generative Model for Remote Sensing

이 논문은 유동 매칭 (flow matching) 생성 패러다임과 적응형 조건 주입기 (ACor) 및 시공간 인식 변조기 (STM) 를 활용한 'UniTS'라는 통합 시공간 생성 모델을 제안하여, 기존에 분리되어 있던 시계열 재구성, 구름 제거, 변화 탐지, 예측 등 다양한 원격 탐사 작업을 단일 프레임워크로 통합하고 우수한 성능을 달성했습니다.

Yuxiang Zhang, Shunlin Liang, Wenyuan Li, Han Ma, Jianglei Xu, Yichuan Ma, Jiangwei Xie, Wei Li, Mengmeng Zhang, Ran Tao, Xiang-Gen Xia2026-03-09💻 cs

Exploiting Spatiotemporal Properties for Efficient Event-Driven Human Pose Estimation

이 논문은 이벤트 카메라의 시공간적 특성을 활용하기 위해 점구름 기반 프레임워크에 이벤트 시간 슬라이스 합성곱 모듈과 엣지 강화 표현을 도입하여, 기존 밀집 프레임 변환 방식의 계산 과부하를 줄이면서도 인간 포즈 추정 성능을 향상시키는 방법을 제안합니다.

Haoxian Zhou, Chuanzhi Xu, Langyi Chen, Pengfei Ye, Haodong Chen, Yuk Ying Chung, Qiang Qu2026-03-09🤖 cs.AI

DFIR-DETR: Frequency-Domain Iterative Refinement and Dynamic Feature Aggregation for Small Object Detection

이 논문은 복잡한 장면에서의 소형 객체 검출 문제를 해결하기 위해, 구조적으로 복잡한 영역에 집중하는 동적 콘텐츠 - 특징 집계 (DCFA), 노름 보존 업샘플링을 통한 공간 세부 정보 복원, 그리고 주파수 도메인에서 고주파 경계 성분을 직접 보존하는 반복적 정제 모듈 (FIRC3) 을 통합한 DFIR-DETR 을 제안합니다.

Bo Gao, Jingcheng Tong, Xingsheng Chen, Han Yu, Zichen Li2026-03-09🤖 cs.LG

Uncertainty-Aware Subset Selection for Robust Visual Explainability under Distribution Shifts

이 논문은 기존 부분집합 선택 기반 시각 설명 방법이 분포 외 (OOD) 환경에서 신뢰도가 떨어진다는 문제를 지적하고, 추가 학습 없이 불확실성 추정을 서브모듈러 최적화와 결합하여 OOD 상황뿐만 아니라 분포 내 (ID) 환경에서도 견고하고 정확한 설명을 제공하는 새로운 프레임워크를 제안합니다.

Madhav Gupta, Vishak Prasad C, Ganesh Ramakrishnan2026-03-09🤖 cs.LG

Photo3D: Advancing Photorealistic 3D Generation through Structure-Aligned Detail Enhancement

이 논문은 GPT-4o-Image 가 생성한 이미지를 기반으로 구조 정렬 다중 뷰 합성 파이프라인과 지각적 특징 적응을 활용한 세부 사항 향상 기법을 도입하여, 3D 기하학적 구조를 보존하면서도 사실적인 외관을 구현하는 새로운 3D 생성 프레임워크인 Photo3D 를 제안합니다.

Xinyue Liang, Zhinyuan Ma, Lingchen Sun, Yanjun Guo, Lei Zhang2026-03-09💻 cs

A Novel Patch-Based TDA Approach for Computed Tomography Imaging

이 논문은 고해상도 CT 영상의 계산 비용과 성능 한계를 극복하기 위해 패치 기반의 지속적 호몰로지 (Persistent Homology) 접근법을 제안하고, 기존 3D 큐빅 복합체 방법 및 방사선학적 특징보다 우수한 분류 성능과 계산 효율성을 입증했습니다.

Dashti A. Ali, Aras T. Asaad, Jacob J. Peoples, Mohammad Hamghalam, Natalie Gangai, Richard K. G. Do, Alice C. Wei, Amber L. Simpson2026-03-09🤖 cs.LG

Spatial4D-Bench: A Versatile 4D Spatial Intelligence Benchmark

이 논문은 MLLM 의 4 차원 공간 지능 능력을 종합적으로 평가하기 위해 18 가지 과제로 구성된 대규모 벤치마크 'Spatial4D-Bench'를 제안하고, 현재 최첨단 모델들이 경로 계획 및 물리적 타당성 추론 등 다양한 4 차원 공간 추론 분야에서 인간 수준의 능력을 달성하지 못함을 규명합니다.

Pan Wang, Yang Liu, Guile Wu, Eduardo R. Corral-Soto, Chengjie Huang, Binbin Xu, Dongfeng Bai, Xu Yan, Yuan Ren, Xingxin Chen, Yizhe Wu, Tao Huang, Wenjun Wan, Xin Wu, Pei Zhou, Xuyang Dai, Kangbo Lv, Hongbo Zhang, Yosef Fried, Aixue Ye, Bailan Feng, Zhenyu Chen, Zhen Li, Yingcong Chen, Yiyi Liao, Bingbing Liu2026-03-09💻 cs