VLMQ: Token Saliency-Driven Post-Training Quantization for Vision-language Models

이 논문은 비전 - 언어 모델 (VLM) 의 활성화 특성을 분석하여 시각 토큰의 과잉 표현과 모달리티 간극 문제를 해결하기 위해, 토큰별 중요도를 고려한 선택적 양자화 전략을 도입함으로써 저비트 환경에서도 기존 방법보다 뛰어난 성능을 달성하는 VLMQ 라는 새로운 Post-Training Quantization 프레임워크를 제안합니다.

Yufei Xue, Yushi Huang, Jiawei Shao, Lunjie Zhu, Chi Zhang, Xuelong Li, Jun Zhang2026-03-09🤖 cs.AI

SGDFuse: SAM-Guided Diffusion Model for High-Fidelity Infrared and Visible Image Fusion

본 논문은 SAM(Segment Anything Model) 이 생성한 고품질 의미 분할 마스크를 명시적 사전 지식으로 활용하여 조건부 확산 모델을 안내함으로써, 열화상 및 가시광선 이미지 융합에서 주요 대상의 보존과 아티팩트 감소를 동시에 달성하는 SGDFuse 를 제안합니다.

Xiaoyang Zhang, jinjiang Li, Guodong Fan, Yakun Ju, Linwei Fan, Jun Liu, Alex C. Kot2026-03-09🤖 cs.AI

Multivariate Fields of Experts for Convergent Image Reconstruction

이 논문은 \ell_\infty-노름의 모reau 포락선을 기반으로 한 다변량 잠재 함수를 도입하여 기존 Fields of Experts 방법을 일반화함으로써, 딥러닝 기반 정규화자와 유사한 성능을 유지하면서도 더 적은 데이터와 파라미터로 빠른 수렴 보장을 제공하는 새로운 이미지 재구성 프레임워크를 제안합니다.

Stanislas Ducotterd, Michael Unser2026-03-09🤖 cs.LG

SSL-SLR: Self-Supervised Representation Learning for Sign Language Recognition

이 논문은 수어 인식의 어려움인 데이터 부족과 부정적 쌍의 유사성 문제를 해결하기 위해, 자유 부정 쌍을 활용한 새로운 자기지도 학습 접근법과 데이터 증강 기법을 결합한 SSL-SLR 프레임워크를 제안하여 다양한 평가에서 기존 방법보다 우수한 성능을 입증했습니다.

Ariel Basso Madjoukeng, Jérôme Fink, Pierre Poitier, Edith Belise Kenmogne, Benoit Frenay2026-03-09💻 cs

RED: Robust Event-Guided Motion Deblurring with Modality-Specific Disentanglement

이 논문은 실제 환경에서 발생하는 이벤트 누락 문제를 해결하기 위해, 다양한 트리거 임계값을 모방하는 강인성 지향 교란 전략과 모달리티별 특징을 분리한 후 선택적으로 융합하는 RED 네트워크를 제안하여 모션 디블러링의 정확도와 강인성을 동시에 향상시킵니다.

Yihong Leng, Siming Zheng, Jinwei Chen, Bo Li, Jiaojiao Li, Peng-Tao Jiang2026-03-09💻 cs

C^2Prompt: Class-aware Client Knowledge Interaction for Federated Continual Learning

이 논문은 연방 지속 학습에서 프롬프트 간 클래스별 지식 일관성 부족으로 인한 공간적 및 시간적 망각 문제를 해결하기 위해, 국소 클래스 분포 보상과 클래스 인식 프롬프트 집계 기법을 도입한 C²Prompt 를 제안하여 최첨단 성능을 달성함을 보여줍니다.

Kunlun Xu, Yibo Feng, Jiangmeng Li, Yongsheng Qi, Jiahuan Zhou2026-03-09🤖 cs.LG

Decision-Driven Semantic Object Exploration for Legged Robots via Confidence-Calibrated Perception and Topological Subgoal Selection

이 논문은 밀집 기하학적 재구성이 필요 없는 신뢰도 보정된 지각과 위상적 하위 목표 선택 메커니즘을 통해 다리가 있는 로봇의 개방형 환경 탐사에서 노이즈가 있는 의미론적 관측을 안정적이고 실행 가능한 의사결정으로 변환하는 새로운 접근법을 제시합니다.

Guoyang Zhao, Yudong Li, Weiqing Qi, Kai Zhang, Bonan Liu, Kai Chen, Haoang Li, Jun Ma2026-03-09💻 cs

DeCLIP: Decoupled Prompting for CLIP-based Multi-Label Class-Incremental Learning

이 논문은 CLIP 기반의 다중 레이블 클래스 증분 학습에서 발생하는 catastrophic forgetting 과 높은 오검출률을 해결하기 위해, 각 클래스별 프롬프트 공간을 분리하는 'DeCLIP' 프레임워크와 오검출률을 억제하는 'AST' 전략을 제안하여 재현 데이터 없이도 기존 방법보다 우수한 성능을 달성함을 보여줍니다.

Kaile Du, Zihan Ye, Junzhou Xie, Yixi Shen, Yuyang Li, Fuyuan Hu, Ling Shao, Guangcan Liu, Joost van de Weijer, Fan Lyu2026-03-09💻 cs

LikePhys: Evaluating Intuitive Physics Understanding in Video Diffusion Models via Likelihood Preference

이 논문은 비디오 확산 모델의 직관적 물리 이해 능력을 시각적 외관과 분리하여 평가하기 위해, 생성된 비디오의 물리 타당성을 확률 기반 선호도로 측정하는 훈련 없는 방법인 LikePhys 를 제안하고, 이를 통해 현재 모델들의 물리 이해 능력이 규모 확장에 따라 점진적으로 향상되고 있음을 입증합니다.

Jianhao Yuan, Fabio Pizzati, Francesco Pinto, Lars Kunze, Ivan Laptev, Paul Newman, Philip Torr, Daniele De Martini2026-03-09🤖 cs.AI

Think with 3D: Geometric Imagination Grounded Spatial Reasoning from Limited Views

이 논문은 제한된 2D 뷰만으로도 인간과 유사한 3D 공간 상상력을 통해 추론할 수 있도록, 3D 사전 지식이나 명시적 3D 데이터 없이도 3D 잠재 공간 정합 및 결과 기반 최적화를 통해 훈련된 새로운 프레임워크인 3DThinker 를 제안합니다.

Zhangquan Chen, Manyuan Zhang, Xinlei Yu, Xufang Luo, Mingze Sun, Zihao Pan, Xiang An, Yan Feng, Peng Pei, Xunliang Cai, Ruqi Huang2026-03-09🤖 cs.AI

The Persistence of Cultural Memory: Investigating Multimodal Iconicity in Diffusion Models

이 논문은 생성형 AI 모델이 문화적 아이콘을 처리할 때 단순한 복제가 아닌 '인식'과 '구현'의 두 차원을 구분하는 새로운 평가 프레임워크와 '문화적 참조 변환 (CRT)' 지표를 제안하며, 모델의 행동이 학습 데이터 빈도뿐만 아니라 텍스트 고유성, 참조의 인기도, 제작 시기 등 다양한 요인에 의해 결정됨을 규명합니다.

Maria-Teresa De Rosa Palmini, Eva Cetinic2026-03-09🤖 cs.AI

Co-Layout: LLM-driven Co-optimization for Interior Layout

이 논문은 대규모 언어 모델 (LLM) 과 그리드 기반 정수 계획법을 결합하여 텍스트 프롬프트에서 구조화된 제약 조건을 추출하고, coarse-to-fine 최적화 전략을 통해 방 배치와 가구 배치를 공동으로 최적화하는 새로운 자동 인테리어 디자인 프레임워크인 'Co-Layout'을 제안합니다.

Chucheng Xiang, Ruchao Bao, Biyin Feng, Wenzheng Wu, Zhongyuan Liu, Yirui Guan, Ligang Liu2026-03-09💬 cs.CL