eStonefish-Scenes: A Sim-to-Real Validated and Robot-Centric Event-based Optical Flow Dataset for Underwater Vehicles

Die Arbeit stellt eStonefish-Scenes, einen synthetischen, auf dem Stonefish-Simulator basierenden optischen Fluss-Datensatz für Unterwasser-Ereigniskameras, zusammen mit der Bibliothek eWiz vor und validiert deren erfolgreiche Sim-to-Real-Übertragbarkeit durch den Einsatz eines ausschließlich auf synthetischen Daten trainierten ConvGRU-Netzwerks auf realen Unterwassersequenzen.

Jad Mansour, Sebastian Realpe, Hayat Rajani + 3 more2026-02-23💻 cs

Mod-Adapter: Tuning-Free and Versatile Multi-concept Personalization via Modulation Adapter

Die Arbeit stellt Mod-Adapter vor, eine feinstimmungsfreie Methode zur personalisierten Bildgenerierung, die mithilfe eines neuartigen Modulationsadapters, Vision-Language-Cross-Attention und einer VLM-gesteuerten Vortrainierungsstrategie sowohl Objekt- als auch abstrakte Konzepte (wie Pose oder Beleuchtung) effektiv in Diffusions-Transformer-Modellen kombiniert.

Weizhi Zhong, Huan Yang, Zheng Liu + 5 more2026-02-23💻 cs

GraphGSOcc: Semantic-Geometric Graph Transformer with Dynamic-Static Decoupling for 3D Gaussian Splatting-based Occupancy Prediction

Das Paper stellt GraphGSOcc vor, einen neuartigen Framework für die 3D-semantische Okklusionsvorhersage, der durch die Kombination von semantisch-geometrischen Graph-Transformern und einer dynamisch-statischen Entkopplung die Grenzen bestehender 3D-Gaussian-Splatting-Methoden überwindet und dabei sowohl die Genauigkeit als auch die Speichereffizienz signifikant verbessert.

Ke Song, Yunhe Wu, Chunchit Siu + 1 more2026-02-23🤖 cs.AI

ViGText: Deepfake Image Detection with Vision-Language Model Explanations and Graph Neural Networks

Die Arbeit stellt ViGText vor, ein neuartiges Deepfake-Erkennungssystem, das durch die Integration von Bild-Patches und detaillierten Texterklärungen eines Vision-Language-Modells in einem Graph Neural Network-basierten Rahmenwerk die Generalisierungsfähigkeit und Robustheit gegenüber fortgeschrittenen Manipulationen signifikant verbessert.

Ahmad ALBarqawi, Mahmoud Nazzal, Issa Khalil + 2 more2026-02-23🤖 cs.AI

Investigating Demographic Bias in Brain MRI Segmentation: A Comparative Study of Deep-Learning and Non-Deep-Learning Methods

Diese Studie untersucht die demografische Verzerrung von Deep-Learning- und traditionellen Segmentierungsmethoden für den Nucleus accumbens in MRT-Bildern und zeigt, dass zwar die Trainingsdaten-Rasse die Genauigkeit beeinflusst, die meisten Modelle jedoch race-spezifische Volumeneffekte nicht korrekt abbilden, während geschlechtsspezifische Unterschiede erhalten bleiben.

Ghazal Danaee, Marc Niethammer, Jarrett Rushmore + 1 more2026-02-23💻 cs

Perception-to-Pursuit: Track-Centric Temporal Reasoning for Open-World Drone Detection and Autonomous Chasing

Die Arbeit stellt „Perception-to-Pursuit" (P2P) vor, ein track-zentriertes Framework, das durch temporale Schlussfolgerung über kompakte Bewegungs-Token nicht nur die Flugbahn von Drohnen präzise vorhersagt, sondern auch deren physisch machbare Verfolgung ermöglicht, was zu einer signifikanten Verbesserung der Verfolgbarkeit im Vergleich zu reinen Tracking-Methoden führt.

Venkatakrishna Reddy Oruganti2026-02-23💻 cs

UrbanGS: A Scalable and Efficient Architecture for Geometrically Accurate Large-Scene Reconstruction

UrbanGS ist ein skalierbares Rekonstruktionsframework für städtische Umgebungen, das durch eine depth-konsistente D-Normal-Regularisierung, eine räumlich adaptive Gauß-Pruning-Strategie und ein einheitliches Partitionierungsschema geometrische Genauigkeit, Speicher-effizienz und Rendering-Qualität in großflächigen Szenen verbessert.

Changbai Li, Haodong Zhu, Hanlin Chen + 6 more2026-02-23💻 cs