Small Object Detection Model with Spatial Laplacian Pyramid Attention and Multi-Scale Features Enhancement in Aerial Images

본 논문은 항공 이미지 내의 작은 객체 검출 성능을 향상시키기 위해 ResNet-50 에 공간 라플라시안 피라미드 주의 (SLPA) 모듈을 도입하고, FPN 의 측면 연결부에 다중 스케일 특징 향상 모듈 (MSFEM) 을 적용하며, 특징 정렬을 위해 변형 합성곱을 활용한 새로운 검출 모델을 제안하고 VisDrone 과 DOTA 데이터셋에서 그 우수성을 입증했습니다.

Zhangjian Ji, Huijia Yan, Shaotong Qiao + 2 more2026-02-27💻 cs

D-FINE-seg: Object Detection and Instance Segmentation Framework with multi-backend deployment

이 논문은 D-FINE 아키텍처에 경량 마스크 헤드와 세그멘테이션 인식 학습 기법을 도입하여 실시간 객체 검출 및 인스턴스 세그멘테이션 성능을 향상시키고, ONNX, TensorRT, OpenVINO 등 다양한 백엔드에서의 최적화된 추론을 지원하는 오픈소스 프레임워크 D-FINE-seg 를 제안합니다.

Argo Saakyan, Dmitry Solntsev2026-02-27💻 cs

Align then Adapt: Rethinking Parameter-Efficient Transfer Learning in 4D Perception

이 논문은 4D 데이터의 부족과 전이 학습의 한계를 극복하기 위해 최적 수송 이론을 활용한 '정렬 (Align)' 단계와 효율적 어댑터를 통한 '적응 (Adapt)' 단계를 순차적으로 수행하는 새로운 파라미터 효율적 전이 학습 프레임워크인 PointATA 를 제안하여, 3D 사전 학습 모델을 4D 인식 작업에 효과적으로 적용할 수 있음을 보여줍니다.

Yiding Sun, Jihua Zhu, Haozhe Cheng + 4 more2026-02-27💻 cs

Locally Adaptive Decay Surfaces for High-Speed Face and Landmark Detection with Event Cameras

이 논문은 이벤트 카메라의 희소하고 비동기적인 출력을 처리할 때 공간적 구조와 모션 선명도 사이의 균형을 최적화하기 위해 지역적 신호 동역학에 따라 감쇠를 조절하는 '국소 적응형 감쇠 표면 (LADS)'을 제안하여, 기존 방법보다 높은 정확도로 얼굴 탐지 및 랜드마크 검출 성능을 향상시키고 더 가벼운 네트워크 구조로도 실시간 처리가 가능하도록 함을 보여줍니다.

Paul Kielty, Timothy Hanley, Peter Corcoran2026-02-27💻 cs

FLIGHT: Fibonacci Lattice-based Inference for Geometric Heading in real-Time

이 논문은 노이즈와 아웃라이어에 강인하면서도 실시간으로 카메라 헤딩을 추정하기 위해 단위 구를 피보나치 격자로 이산화하고 대원 투표를 수행하는 새로운 기하학적 추론 방법인 FLIGHT 를 제안하며, 이를 통해 SLAM 초기화 시 오차를 줄이고 정확도와 효율성의 최적 균형을 달성함을 보여줍니다.

David Dirnfeld, Fabien Delattre, Pedro Miraldo + 1 more2026-02-27💻 cs

Devling into Adversarial Transferability on Image Classification: Review, Benchmark, and Evaluation

이 논문은 이미지 분류에서의 적대적 전이성 (adversarial transferability) 에 대한 포괄적인 검토와 6 가지 범주로 분류된 공격 기법들을 체계화하고, 편향된 평가를 방지하기 위한 표준 벤치마크 프레임워크를 제안하며 전이성 향상 전략과 공정한 비교를 위한 주의점을 제시합니다.

Xiaosen Wang, Zhijin Ge, Bohan Liu + 5 more2026-02-27🤖 cs.AI

TriLite: Efficient Weakly Supervised Object Localization with Universal Visual Features and Tri-Region Disentanglement

이 논문은 이미지 레벨 라벨만으로 객체 위치를 추정하는 약지도 객체 국소화 (WSOL) 문제를 해결하기 위해, 프리셋된 비전 트랜스포머와 TriHead 모듈을 활용하여 최소한의 학습 파라미터로 최첨단 성능을 달성하는 단일 단계 프레임워크 'TriLite'를 제안합니다.

Arian Sabaghi, José Oramas2026-02-27💻 cs

From Calibration to Refinement: Seeking Certainty via Probabilistic Evidence Propagation for Noisy-Label Person Re-Identification

이 논문은 소프트맥스의 과도한 자신감과 소실되는 하드 양측 샘플 문제를 해결하기 위해, 확률적 증거 보정을 통해 불확실성을 줄이고 복합 각도 마진 및 확실성 기반 구 가중치를 통해 노이즈가 포함된 라벨 데이터에서 사람 재식별 (Re-ID) 성능을 향상시키는 CARE 프레임워크를 제안합니다.

Xin Yuan, Zhiyong Zhang, Xin Xu + 2 more2026-02-27💻 cs

No Labels, No Look-Ahead: Unsupervised Online Video Stabilization with Classical Priors

이 논문은 레이블과 미리보기가 없는 비지도 온라인 비디오 안정화를 위해 고전적 사전 지식과 멀티스레드 버퍼링을 결합한 새로운 프레임워크를 제안하고, UAV 야간 원격 감지 등 기존 데이터셋의 한계를 극복하기 위한 새로운 멀티모달 데이터셋 (UAV-Test) 을 구축하여 오프라인 방법과 비교할 수 있는 성능을 달성함을 보여줍니다.

Tao Liu, Gang Wan, Kan Ren + 1 more2026-02-27💻 cs

Partial recovery of meter-scale surface weather

이 논문은 기존 관측 데이터와 고해상도 지구 관측 자료를 결합하여 대륙 규모에서 10m 해상도의 국소적 지표면 기상 (바람, 온도, 습도) 을 통계적으로 복원할 수 있음을 입증함으로써, 기존 모델보다 정확도가 높고 물리적으로 해석 가능한 미시적 기상 정보를 제공할 수 있음을 보여줍니다.

Jonathan Giezendanner, Qidong Yang, Eric Schmitt + 7 more2026-02-27🤖 cs.LG

Phys-3D: Physics-Constrained Real-Time Crowd Tracking and Counting on Railway Platforms

이 논문은 기차에 장착된 단일 카메라를 통해 플랫폼의 혼잡한 군중을 실시간으로 추적하고 계수하기 위해, 물리 법칙을 기반으로 한 3D 운동 추론과 검출 및 외관 정보를 통합한 'Phys-3D' 프레임워크를 제안하여 기존 방법의 한계를 극복하고 높은 정확도를 달성함을 보여줍니다.

Bin Zeng, Johannes Künzel, Anna Hilsmann + 1 more2026-02-27💻 cs

ColoDiff: Integrating Dynamic Consistency With Content Awareness for Colonoscopy Video Generation

이 논문은 불규칙한 장 구조와 다양한 임상 속성 제어의 어려움을 극복하고 데이터 부족을 해결하기 위해 시간적 일관성과 내용 인식을 통합한 'ColoDiff'라는 확산 기반 프레임워크를 제안하여 고품질의 대장내시경 영상을 생성하고 진단 등 하류 작업을 지원함을 보여줍니다.

Junhu Fu, Shuyu Liang, Wutong Li + 9 more2026-02-27🤖 cs.AI