Small Object Detection in Complex Backgrounds with Multi-Scale Attention and Global Relation Modeling

Dieser Beitrag stellt ein Framework zur Erkennung kleiner Objekte in komplexen Hintergründen vor, das durch die Kombination von Residual-Haar-Wavelet-Downsampling, globaler Relationsmodellierung, hybrider Kreuzskalen-Aufmerksamkeit und einem zentrierungsassistierten Verlust die Merkmalsdegradation überwindet und die Lokalisierungsgenauigkeit auf dem RGBT-Tiny-Benchmark signifikant verbessert.

Wenguang Tao, Xiaotian Wang, Tian Yan + 2 more2026-03-05💻 cs

Adaptive Enhancement and Dual-Pooling Sequential Attention for Lightweight Underwater Object Detection with YOLOv10

Diese Arbeit stellt einen leichten YOLOv10-basierten Rahmen für die Unterwasser-Objekterkennung vor, der durch ein Multi-Stage Adaptive Enhancement, einen Dual-Pooling Sequential Attention-Mechanismus und eine Focal Generalized IoU-Verlustfunktion die Genauigkeit und Robustheit bei gleichzeitiger Kompaktheit des Modells signifikant verbessert.

Md. Mushibur Rahman, Umme Fawzia Rahim, Enam Ahmed Taufik2026-03-05💻 cs

Structure-aware Prompt Adaptation from Seen to Unseen for Open-Vocabulary Compositional Zero-Shot Learning

Die Arbeit stellt die Methode „Structure-aware Prompt Adaptation" (SPA) vor, die durch die Nutzung konsistenter lokaler Strukturen im Embedding-Raum und die Anwendung einer strukturgesteuerten Anpassungsstrategie die Generalisierung von gesehenen auf ungesehene Attribut-Objekt-Kombinationen im Open-Vocabulary Compositional Zero-Shot Learning verbessert.

Yihang Duan, Jiong Wang, Pengpeng Zeng + 5 more2026-03-05💻 cs

Universal Pansharpening Foundation Model

Das Paper stellt FoundPS vor, ein universelles Fundamentmodell für die Panscharpierung, das durch einen modality-interleaved Transformer, einen latenten Diffusions-Bridge-Ansatz und eine umfassende Benchmark (PSBench) eine satellitenunabhängige und szenenrobuste Fusion von Panchromatik- und Multispektralbildern ermöglicht, die den aktuellen State-of-the-Art in Bezug auf Generalisierung und Robustheit übertrifft.

Hebaixu Wang, Jing Zhang, Haonan Guo + 4 more2026-03-05💻 cs

All-in-One Image Restoration via Causal-Deconfounding Wavelet-Disentangled Prompt Network

Die vorgestellte Arbeit stellt CWP-Net vor, ein neues Kausal-Deconfounding-Netzwerk mit wavelet-basierten Entwirrungsmodulen und Prompts, das die Generalisierung und Leistung von All-in-One-Bildwiederherstellungssystemen verbessert, indem es spuriose Korrelationen zwischen semantischen Merkmalen und Degradationsmustern sowie verzerrte Degradationsschätzungen adressiert.

Bingnan Wang, Bin Qin, Jiangmeng Li + 3 more2026-03-05💻 cs