LiM-YOLO: Less is More with Pyramid Level Shift and Normalized Auxiliary Branch for Ship Detection in Optical Remote Sensing Imagery

이 논문은 위성 영상 내 선박 검출의 극심한 크기 차이와 높은 종횡비 문제를 해결하기 위해, 기존 YOLO 아키텍처의 피라미드 레벨을 P3-P5 에서 P2-P4 로 전환하고 그룹 정규화를 적용하여 정확도와 효율성을 동시에 극대화한 'LiM-YOLO'를 제안합니다.

Seon-Hoon Kim, Hyeji Sim, Youeyun Jung, Ok-Chul Jung, Yerin Kim2026-03-11⚡ eess

ADHint: Adaptive Hints with Difficulty Priors for Reinforcement Learning

이 논문은 강화학습의 학습 안정성과 효율성을 높이기 위해 샘플 난이도를 기반으로 힌트 비율을 동적으로 조정하고, 일관성 기반 그래디언트 조절과 롤아웃 난이도 사후확률을 활용한 이점 추정을 도입한 'ADHint'라는 새로운 방법을 제안합니다.

Feng Zhang, Zezhong Tan, Xinhong Ma, Ziqiang Dong, Xi Leng, Jianfei Zhao, Xin Sun, Yang Yang2026-03-11🤖 cs.LG

Taming Preference Mode Collapse via Directional Decoupling Alignment in Diffusion Reinforcement Learning

이 논문은 인간 선호도 기반 강화학습을 통한 텍스트-이미지 생성 모델의 '선호도 모드 붕괴 (Preference Mode Collapse)' 현상을 규명하고, 이를 해결하기 위해 보상 신호를 방향적으로 보정하여 생성 다양성을 유지하는 새로운 프레임워크인 '방향성 분해 정렬 (D²-Align)'을 제안합니다.

Chubin Chen, Sujie Hu, Jiashu Zhu, Meiqi Wu, Jintao Chen, Yanxun Li, Nisha Huang, Chengyu Fang, Jiahong Wu, Xiangxiang Chu, Xiu Li2026-03-11💻 cs

CLEAR-Mamba:Towards Accurate, Adaptive and Trustworthy Multi-Sequence Ophthalmic Angiography Classification

이 논문은 단일 모드, 미세 병변 패턴, 장비 간 편차로 인한 한계를 극복하기 위해 하이퍼네트워크 기반 적응적 조건부 레이어 (HaC) 와 증거 불확실성 학습 기반 신뢰성 예측 체계 (RaP) 를 도입한 CLEAR-Mamba 프레임워크를 제안하여, FFA 및 ICGA 영상을 포함한 대규모 안과 혈관조영 데이터셋에서 기존 모델보다 뛰어난 분류 성능과 신뢰성을 입증했습니다.

Zhuonan Wang, Wenjie Yan, Wenqiao Zhang, Xiaohui Song, Jian Ma, Ke Yao, Yibo Yu, Beng Chin Ooi2026-03-11🤖 cs.AI

RegionReasoner: Region-Grounded Multi-Round Visual Reasoning

이 논문은 다중 턴 시각 추론을 위한 새로운 벤치마크 'RegionDial-Bench'를 제안하고, 각 추론 단계에서 명시적인 바운딩 박스 인용과 전역 - 지역 일관성 보상을 통해 강화 학습을 수행하는 'RegionReasoner' 프레임워크를 소개함으로써 시각적 추론의 정확성과 공간적 근거 능력을 획기적으로 향상시킵니다.

Wenfang Sun, Hao Chen, Yingjun Du, Yefeng Zheng, Cees G. M. Snoek2026-03-11💻 cs

WebAccessVL: Violation-Aware VLM for Web Accessibility

이 논문은 웹 콘텐츠 접근성 가이드라인 (WCAG2) 위반 사항을 자동으로 수정하면서도 원본 디자인을 유지하는 비전 - 언어 모델 'WebAccessVL'을 제안하고, 위반 조건을 입력으로 활용하는 반복적 개선 전략을 통해 기존 모델 대비 접근성 오류를 87% 이상 감소시킨 효과를 입증했습니다.

Amber Yijia Zheng, Jae Joong Lee, Bedrich Benes, Raymond A. Yeh2026-03-11🤖 cs.AI

Pathwise Test-Time Correction for Autoregressive Long Video Generation

이 논문은 증류된 자기회귀 모델의 장기간 비디오 생성 시 발생하는 오류 누적을 해결하기 위해, 초기 프레임을 안정적 기준점으로 활용하여 샘플링 경로를 보정하는 훈련 없는 '테스트 시간 보정 (TTC)' 방법을 제안하고, 이를 통해 30 초 길이의 비디오 생성에서 기존 훈련 기반 방법과媲美하는 품질을 낮은 오버헤드로 달성함을 입증합니다.

Xunzhi Xiang, Zixuan Duan, Guiyu Zhang, Haiyu Zhang, Zhe Gao, Junta Wu, Shaofeng Zhang, Tengfei Wang, Qi Fan, Chunchao Guo2026-03-11💻 cs

Energy-Aware Spike Budgeting for Continual Learning in Spiking Neural Networks for Neuromorphic Vision

이 논문은 기존 방법론이 간과했던 정확도와 에너지 효율성의 동시 최적화를 위해 경험 재생, 가변적 누적 - 적분 - 방출 뉴런 매개변수, 적응형 스파이크 스케줄러를 통합한 에너지 인식 스파이크 예산 관리 프레임워크를 제안하여, 프레임 기반 및 이벤트 기반 데이터셋 모두에서 지속적 학습 성능을 향상시키고 동적 전력 소비를 최소화하는 뉴로모픽 비전 시스템의 실용성을 입증합니다.

Anika Tabassum Meem, Muntasir Hossain Nadid, Md Zesun Ahmed Mia2026-03-11🤖 cs.AI

Exploiting Completeness Perception with Diffusion Transformer for Unified 3D MRI Synthesis

이 논문은 임상 환경에서 외부 가이드 없이도 결손 상태를 스스로 인식하여 3D MRI 의 완전성을 파악하고 생성할 수 있도록 설계된 'CoPeDiT'라는 새로운 잠재 확산 모델을 제안하며, 이를 통해 다양한 결손 패턴에서도 높은 정확도와 구조적 일관성을 갖춘 고품질 3D MRI 합성을 가능하게 합니다.

Junkai Liu, Nay Aung, Theodoros N. Arvanitis, Joao A. C. Lima, Steffen E. Petersen, Le Zhang2026-03-11⚡ eess

DOCFORGE-BENCH: A Comprehensive 0-shot Benchmark for Document Forgery Detection and Analysis

이 논문은 학습 데이터 없이 다양한 문서 위조 검출 방법을 평가한 'DOCFORGE-BENCH' 벤치마크를 제시하며, 기존 방법들이 임계값 보정 실패로 인해 실제 배포 환경에서 성능이 크게 저하됨을 규명하고 문서 위조 탐지가 여전히 해결되지 않은 문제임을 강조합니다.

Zengqi Zhao, Weidi Xia, En Wei, Yan Zhang, Jane Mo, Tiannan Zhang, Yuanqin Dai, Zexi Chen, Yiran Tao, Simiao Ren2026-03-11💻 cs

Pri4R: Learning World Dynamics for Vision-Language-Action Models with Privileged 4D Representation

이 논문은 훈련 시 3D 포인트 트랙 예측을 위한 특권 4D 정보를 활용하여 VLA 모델이 물리적 상호작용의 시공간적 역학을 내재적으로 학습하도록 함으로써 추론 시 추가 비용 없이 로봇 조작 성능을 크게 향상시키는 'Pri4R' 방법을 제안합니다.

Jisoo Kim, Jungbin Cho, Sanghyeok Chu, Ananya Bal, Jinhyung Kim, Gunhee Lee, Sihaeng Lee, Seung Hwan Kim, Bohyung Han, Hyunmin Lee, Laszlo A. Jeni, Seungryong Kim2026-03-11🤖 cs.AI