GeoAlignCLIP: Enhancing Fine-Grained Vision-Language Alignment in Remote Sensing via Multi-Granular Consistency Learning

이 논문은 원격 탐사 분야에서 기존 방법의 한계를 극복하고 정밀한 시각 - 언어 정렬을 달성하기 위해 다중 세분화 일관성 학습을 도입한 GeoAlignCLIP 프레임워크와 RSFG-100k 데이터셋을 제안하고, 다양한 벤치마크에서 기존 방법보다 우수한 성능을 입증합니다.

Xiao Yang, Ronghao Fu, Zhuoran Duan, Zhiwen Lin, Xueyan Liu, Bo Yang2026-03-11💻 cs

More than the Sum: Panorama-Language Models for Adverse Omni-Scenes

이 논문은 핀홀 이미지의 단순 합을 넘어 전경 (panorama) 고유의 전체적 공간 및 맥락 관계를 포착하는 '전경 - 언어 모델링 (PLM)' 패러다임을 제안하고, 이를 위해 재학습 없이 기존 모델에 적용 가능한 희소 어텐션 모듈과 악천후 및 사고 등 다양한 전경 시나리오를 포함하는 대규모 데이터셋 'PanoVQA'를 개발하여 전경 기반의 견고한 시각 - 언어 추론을 가능하게 했습니다.

Weijia Fan, Ruiping Liu, Jiale Wei, Yufan Chen, Junwei Zheng, Zichao Zeng, Jiaming Zhang, Qiufu Li, Linlin Shen, Rainer Stiefelhagen2026-03-11💻 cs

BinaryAttention: One-Bit QK-Attention for Vision and Diffusion Transformers

이 논문은 쿼리와 키의 부호만 남기고 비트 연산으로 어텐션을 계산하는 'BinaryAttention'을 제안하여, 학습 가능한 편향과 양자화 인식 훈련을 통해 1 비트 정량화 손실을 보완하고 기존 풀-프레시전 어텐션보다 정확도를 유지하면서 A100 GPU 에서 FlashAttention2 보다 2 배 이상 빠른 속도를 달성했습니다.

Chaodong Xiao, Zhengqiang Zhang, Lei Zhang2026-03-11💻 cs

Towards Terrain-Aware Safe Locomotion for Quadrupedal Robots Using Proprioceptive Sensing

본 논문은 저비용 4 족 로봇이 관성 측정 장치와 관절 엔코더 등 고유 감각 센서만을 활용하여 2.5 차원 지형 지도를 생성하고 이를 접촉 및 상태 추정과 통합하여 안전 장벽 함수 (CBF) 기반의 안전 제어 시스템을 구축함으로써, 불규칙한 지형에서도 로봇의 안전한 보행을 보장하는 방법을 제시합니다.

Peiyu Yang, Jiatao Ding, Wei Pan, Claudio Semini, Cosimo Della Santina2026-03-11💻 cs

A Generalized Voronoi Graph based Coverage Control Approach for Non-Convex Environment

이 논문은 다중 로봇 시스템이 여러 장애물이 있는 비볼록 환경에서 효율적으로 영역을 커버할 수 있도록, 일반화된 보로노이 그래프 (GVG) 를 기반으로 하중 균형 알고리즘과 협력적 커버리지 제어를 결합한 새로운 방법을 제안하고 그 수렴성과 성능을 시뮬레이션을 통해 검증했습니다.

Zuyi Guo, Ronghao Zheng, Meiqin Liu, Senlin Zhang2026-03-11💻 cs

Nemo: A Low-Write-Amplification Cache for Tiny Objects on Log-Structured Flash Devices

이 논문은 로지크 구조 플래시 장치에서 작은 객체 워크로드의 쓰기 증폭을 줄이기 위해 해시 충돌 확률을 높여 세트 채움률을 개선하고, 메모리 오버헤드를 줄이는 불룸 필터 기반 인덱싱 및 하이브리드 핫니스 추적을 도입한 'Nemo'라는 새로운 캐시 아키텍처를 제안합니다.

Xufeng Yang, Tingting Tan, Jingxin Hu, Congming Gao, Mingyang Liu, Tianyang Jiang, Jian Chen, Linbo Long, Yina Lv, Jiwu Shu2026-03-11💻 cs

A saccade-inspired approach to image classification using visiontransformer attention maps

이 논문은 DINO 비전 트랜스포머의 어텐션 맵을 인간의 주시 패턴과 유사한 시선 이동 (saccade) 전략으로 활용하여 이미지 전체를 처리하지 않고도 핵심 영역에 집중함으로써 분류 성능을 유지하거나 향상시키는 효율적인 이미지 분류 접근법을 제시합니다.

Matthis Dallain, Laurent Rodriguez, Laurent Udo Perrinet, Benoît Miramond2026-03-11💻 cs

OTPL-VIO: Robust Visual-Inertial Odometry with Optimal Transport Line Association and Adaptive Uncertainty

이 논문은 저조도 및 저텍스처 환경에서 기존 점 기반 VIO 의 한계를 극복하기 위해, 학습이 필요 없는 선분 디스크립터와 엔트로피 정규화 최적 수송을 활용한 선분 매칭, 그리고 신뢰도 적응적 가중치 기법을 도입하여 강인성과 정확도를 동시에 향상시킨 스테레오 비전 - 관성 오도메트리 (VIO) 시스템 'OTPL-VIO'를 제안합니다.

Zikun Chen, Wentao Zhao, Yihe Niu, Tianchen Deng, Jingchuan Wang2026-03-11💻 cs

DiffWind: Physics-Informed Differentiable Modeling of Wind-Driven Object Dynamics

이 논문은 비디오 관측을 통해 바람과 물체의 상호작용을 물리 법칙에 기반한 미분 가능한 프레임워크인 DiffWind 로 모델링하여, 3D 가우스 스플래팅과 MPM, LBM 을 활용하여 바람의 힘장을 재구성하고 새로운 바람 조건에서의 시뮬레이션 및 바람 리타게팅을 가능하게 하는 WD-Objects 데이터셋을 포함해 기존 방법보다 뛰어난 정확도와 충실도를 달성함을 제시합니다.

Yuanhang Lei, Boming Zhao, Zesong Yang, Xingxuan Li, Tao Cheng, Haocheng Peng, Ru Zhang, Yang Yang, Siyuan Huang, Yujun Shen, Ruizhen Hu, Hujun Bao, Zhaopeng Cui2026-03-11💻 cs

VarSplat: Uncertainty-aware 3D Gaussian Splatting for Robust RGB-D SLAM

이 논문은 저조도 영역이나 반사 표면과 같은 신뢰할 수 없는 측정값으로 인한 드리프트를 줄이기 위해, 3D 가우스 스플래팅 기반 SLAM 시스템이 각 스플랫의 불확실성을 명시적으로 학습하고 이를 통해 신뢰할 수 있는 영역에 초점을 맞춘 강건한 추론 및 매핑을 가능하게 하는 'VarSplat'을 제안합니다.

Anh Thuan Tran, Jana Kosecka2026-03-11💻 cs

Improving 3D Foot Motion Reconstruction in Markerless Monocular Human Motion Capture

이 논문은 부정확한 주석과 제한된 데이터로 인해 기존 방법들이 한계를 보였던 발의 정밀한 3D 모션 재구성을 위해, 2D 발 키포인트를 3D 로 승격시키고 무릎 및 발 모션 맥락을 활용하는 'FootMR'과 복잡한 발 움직임을 평가할 수 있는 새로운 데이터셋 'MOOF'를 제안하여 기존 최첨단 방법보다 발 관절 각도 오차를 최대 30% 까지 줄이는 성과를 거두었다고 요약할 수 있습니다.

Tom Wehrbein, Bodo Rosenhahn2026-03-11💻 cs