Bridging Human Evaluation to Infrared and Visible Image Fusion

이 논문은 인간 평가와 적외선/가시광선 이미지 융합을 연결하기 위해 대규모 인간 피드백 데이터셋과 보상 모델을 구축하고, 그룹 상대적 정책 최적화를 통해 융합 네트워크를 미세 조정하여 인간 시각적 선호도와 더 잘 부합하는 최첨단 성능을 달성하는 피드백 강화 프레임워크를 제안합니다.

Jinyuan Liu, Xingyuan Li, Qingyun Mei + 5 more2026-03-05💻 cs

Architecture and evaluation protocol for transformer-based visual object tracking in UAV applications

이 논문은 UAV 환경의 동적 제약과 제한된 온보드 자원을 고려하여 트랜스포머 기반 추적기와 확장 칼만 필터를 결합한 모듈형 비동기 추적 아키텍처 (MATA) 와 임베디드 시스템에 적합한 새로운 평가 프로토콜 및 NT2F 지표를 제안하고, 이를 통해 실시간 성능과 견고성을 입증했습니다.

Augustin Borne, Pierre Notin, Christophe Hennequin + 4 more2026-03-05💻 cs

N-gram Injection into Transformers for Dynamic Language Model Adaptation in Handwritten Text Recognition

이 논문은 손글씨 인식에서 훈련 데이터와 다른 언어 분포를 가진 타겟 도메인에서 발생하는 성능 저하를 해결하기 위해, 추가 학습 없이 추론 시 n-그램 언어 모델을 트랜스포머 디코더에 주입하여 동적으로 적응하는 NGI(외부 n-그램 주입) 방법을 제안하고 그 유효성을 입증합니다.

Florent Meyer, Laurent Guichard, Denis Coquenet + 3 more2026-03-05💻 cs

Cross-Modal Mapping and Dual-Branch Reconstruction for 2D-3D Multimodal Industrial Anomaly Detection

본 논문은 메모리 뱅크나 교사 - 학생 구조 없이 RGB 와 3D 지형 정보를 융합하여 노이즈나 결손 모달리티 상황에서도 강인한 이상 탐지를 가능하게 하는 경량화되고 모달리티 유연한 비지도 프레임워크인 'CMDR-IAD'를 제안하며, MVTec 3D-AD 벤치마크와 실제 산업 데이터셋에서 최첨단 성능을 입증했습니다.

Radia Daci, Vito Renò, Cosimo Patruno + 4 more2026-03-05🤖 cs.AI

UniRain: Unified Image Deraining with RAG-based Dataset Distillation and Multi-objective Reweighted Optimization

이 논문은 RAG 기반의 데이터 증류 파이프라인과 다목적 재가중 최적화 전략을 결합한 'UniRain'을 제안하여, 다양한 야간 및 주간 조건에서 비줄무늬와 빗방울로 인한 왜곡을 모두 효과적으로 제거하는 범용 이미지 비 제거 프레임워크를 구축했습니다.

Qianfeng Yang, Qiyuan Guan, Xiang Chen + 3 more2026-03-05💻 cs