RobustGait: Robustness Analysis for Appearance Based Gait Recognition

Das Paper stellt RobustGait vor, ein umfassendes Framework zur feingranularen Robustheitsanalyse von gait-basierten Erkennungssystemen, das durch die Einführung eines neuen Benchmarks mit 15 Korruptionsarten und fünf Schweregraden auf mehreren Datensätzen entscheidende Erkenntnisse über die Auswirkungen von Störungen, Silhouetten-Extraktionsverzerrungen und Architekturen liefert sowie Strategien zur Verbesserung der Einsatzbereitschaft aufzeigt.

Reeshoon Sayera, Akash Kumar, Sirshapan Mitra + 2 more2026-02-26💻 cs

Aerial Vision-Language Navigation with a Unified Framework for Spatial, Temporal and Embodied Reasoning

Die Autoren stellen ein einheitliches Framework für die luftgestützte visuell-sprachliche Navigation vor, das unbemannte Luftfahrzeuge allein auf Basis monokularer RGB-Bilder und natürlicher Sprachanweisungen navigiert, indem es räumliche, zeitliche und verkörperte Schlussfolgerungen durch Prompt-gesteuertes Multi-Task-Learning vereint und dabei bestehende RGB-only-Ansätze deutlich übertrifft.

Huilin Xu, Zhuoyang Liu, Yixiang Luomei + 1 more2026-02-26🤖 cs.AI

FigEx2: Visual-Conditioned Panel Detection and Captioning for Scientific Compound Figures

Die Arbeit stellt FigEx2 vor, ein visuell konditioniertes Framework, das mittels eines rauschangepassten Gating-Moduls und einer gestuften Optimierungsstrategie mit Bestärkendem Lernen automatisch Panels in wissenschaftlichen Compound-Figuren lokalisiert und präzise Bildunterschriften generiert, wodurch es den aktuellen State-of-the-Art-Modellen überlegen ist und eine starke Zero-Shot-Transferfähigkeit in verschiedenen wissenschaftlichen Domänen demonstriert.

Jifeng Song, Arun Das, Pan Wang + 3 more2026-02-26💬 cs.CL

Rectifying Geometry-Induced Similarity Distortions for Real-World Aerial-Ground Person Re-Identification

Die vorgestellte Arbeit adressiert die durch extreme Blickwinkelunterschiede verursachten Verzerrungen bei der Personensuche zwischen Luft- und Bodenaufnahmen, indem sie einen leichten Modul zur geometriebedingten Korrektur des Ähnlichkeitsraums (GIQT) sowie einen geometrieabhängigen Prompt-Mechanismus einführt, um die Zuverlässigkeit von Attention-basierten Matching-Verfahren zu verbessern.

Kailash A. Hambarde, Hugo Proença2026-02-26💻 cs

HetroD: A High-Fidelity Drone Dataset and Benchmark for Autonomous Driving in Heterogeneous Traffic

Das Paper stellt HetroD vor, ein hochauflösendes Drohnendatenset und Benchmark für das autonome Fahren in heterogenem Verkehr, das durch umfangreiche Annotationen von schwachen Verkehrsteilnehmern und neue Evaluierungsergebnisse zeigt, dass bestehende Modelle Schwierigkeiten mit unstrukturierten Manövern und dichten Verkehrsszenen haben.

Yu-Hsiang Chen, Wei-Jer Chang, Christian Kotulla + 7 more2026-02-26💻 cs