Harnessing Chain-of-Thought Reasoning in Multimodal Large Language Models for Face Anti-Spoofing

이 논문은 다양한 스푸핑 공격 유형을 포괄하는 대규모 시각 - 언어 질문 답변 데이터셋 'FaceCoT'와 강화학습 기반 캡션 모델 및 CoT 기반 점진적 학습 전략을 도입하여, 기존 단일 모달리티 기반의 한계를 극복하고 얼굴 생체 인증 위조 탐지 (FAS) 의 일반화 성능과 해석 가능성을 획기적으로 향상시켰습니다.

Honglu Zhang, Zhiqin Fang, Ningning Zhao + 4 more2026-03-03💻 cs

OmniSpatial: Towards Comprehensive Spatial Reasoning Benchmark for Vision Language Models

이 논문은 인지심리학에 기반하여 동적 추론, 복잡한 공간 논리, 공간 상호작용, 시점 전환 등 50 개의 세부 범주로 구성된 포괄적인 벤치마크 'OmniSpatial'을 제안하고, 현재 시각 - 언어 모델들의 공간 추론 한계를 규명하며 이를 개선하기 위한 두 가지 전략을 제시합니다.

Mengdi Jia, Zekun Qi, Shaochen Zhang + 5 more2026-03-03💬 cs.CL

Meta-Adaptive Prompt Distillation for Few-Shot Visual Question Answering

이 논문은 대규모 멀티모달 모델의 소수 샷 시각적 질문 응답 (VQA) 성능을 향상시키기 위해, 태스크 관련 시각적 특징에서 추출된 소프트 프롬프트를 메타 학습 방식으로 증류하고 테스트 시 적응하는 '메타 적응형 프롬프트 증류' 방법을 제안하며, 이를 통해 기존 인-컨텍스트 학습 및 파라미터 효율적 파인튜닝 기법보다 우수한 성능을 입증했습니다.

Akash Gupta, Amos Storkey, Mirella Lapata2026-03-03💬 cs.CL

PD2^{2}GS: Part-Level Decoupling and Continuous Deformation of Articulated Objects via Gaussian Splatting

이 논문은 자기지도 학습을 통해 관절형 물체의 기하학적 구조와 운동학을 동시에 인코딩하는 새로운 프레임워크 PD2^{2}GS 를 제안하고, 이를 통해 매끄러운 연속 제어와 정밀한 부분 단위 분리가 가능하며, 이를 검증하기 위해 실사 - 시뮬레이션 RGB-D 데이터셋 RS-Art 을 공개한 연구입니다.

Haowen Wang, Xiaoping Yuan, Zhao Jin + 6 more2026-03-03💻 cs

NIC-RobustBench: A Comprehensive Open-Source Toolkit for Neural Image Compression and Robustness Analysis

이 논문은 기존 벤치마크가 간과해 온 신경망 이미지 압축 (NIC) 의 적대적 취약성을 평가하기 위해 다양한 공격과 방어 전략, 그리고 하류 작업 영향 분석을 포함하는 오픈소스 프레임워크인 'NIC-RobustBench'를 제안하고 이를 활용한 포괄적인 실증 연구를 수행했습니다.

Georgii Bychkov, Khaled Abud, Egor Kovalev + 4 more2026-03-03⚡ eess

Advancing Complex Video Object Segmentation via Progressive Concept Construction

이 논문은 대규모 비전 - 언어 모델을 활용하여 새로운 장면이 등장할 때만 개념적 특징을 주입하는 '세그먼트 컨셉 (SeC)' 프레임워크와 이를 평가하기 위한 'SeCVOS' 벤치마크를 제안함으로써, 기존 방법론보다 복잡한 비디오 객체 분할 성능을 획기적으로 향상시켰음을 보여줍니다.

Zhixiong Zhang, Shuangrui Ding, Xiaoyi Dong + 7 more2026-03-03🤖 cs.AI

Digital and Robotic Twinning for Validation of Proximity Operations and Formation Flying

이 논문은 스탠포드 대학의 로봇 테스트베드를 활용한 하이브리드 디지털 및 로봇 트윈 프레임워크를 제시하여, 궤도 근접 임무 및 형성 비행의 안전성 필수 GNC 시스템을 소프트웨어 및 하드웨어-in-the-루프 테스트를 통해 통합적으로 검증하고 그 일관성을 입증했습니다.

Z. Ahmed, E. Bates, P. Francesch Huc + 5 more2026-03-03💻 cs