No Labels, No Look-Ahead: Unsupervised Online Video Stabilization with Classical Priors

Die Autoren stellen ein unüberwachtes, online-fähiges Framework zur Videostabilisierung vor, das auf klassischen Priors basiert, um die Nachteile datenhungriger Deep-Learning-Ansätze zu umgehen, und führen zudem einen neuen multimodalen UAV-Datensatz ein, um die Stabilisierung auch in anspruchsvollen Szenarien wie der nächtlichen Fernerkundung zu ermöglichen.

Tao Liu, Gang Wan, Kan Ren + 1 more2026-02-27💻 cs

Latent Gaussian Splatting for 4D Panoptic Occupancy Tracking

Die Arbeit stellt LaGS vor, eine neue Methode zur 4D-panoptischen Occupancy-Tracking, die End-to-End-Tracking mit maskenbasierter Segmentierung kombiniert und durch einen neuartigen latenten Gaussian-Splatting-Ansatz eine effiziente Aggregation von Multi-View-Daten in 3D-Voxel-Grids ermöglicht, wodurch sie auf den Datensätzen Occ3D nuScenes und Waymo den State-of-the-Art erreicht.

Maximilian Luz, Rohit Mohan, Thomas Nürnberg + 3 more2026-02-27🤖 cs.AI

UniScale: Unified Scale-Aware 3D Reconstruction for Multi-View Understanding via Prior Injection for Robotic Perception

Das Paper stellt UniScale vor, ein einheitliches, skalierbares 3D-Rekonstruktionsframework für die robotische Wahrnehmung, das durch modulare Integration geometrischer Priors und einen einzigen Feed-Forward-Netzwerk metrische Tiefen- und Kameraparameter aus Multi-View-Bildern schätzt, ohne dass ein Training von Grund auf erforderlich ist.

Mohammad Mahdavian, Gordon Tan, Binbin Xu + 3 more2026-02-27💻 cs

Decomposing Private Image Generation via Coarse-to-Fine Wavelet Modeling

Diese Arbeit stellt einen spektralen Differenziellen-Privatsphäre-Rahmen vor, der die Bildgenerierung durch eine zweistufige Methode verbessert, bei der ein privates Modell nur die niedrigfrequenten Wavelet-Koeffizienten für grobe Strukturen lernt, während hochauflösende Details über ein öffentliches Super-Resolution-Modell hinzugefügt werden, um so die Bildqualität bei starken Privatsphäre-Garantien zu erhalten.

Jasmine Bayrooti, Weiwei Kong, Natalia Ponomareva + 3 more2026-02-27💻 cs

LineGraph2Road: Structural Graph Reasoning on Line Graphs for Road Network Extraction

Der Artikel stellt LineGraph2Road vor, ein Framework, das durch die Umformulierung der Straßenverbindungsvorhersage als binäre Klassifikation auf einer globalen Graphenstruktur und die Anwendung eines Graph-Transformers auf den zugehörigen Liniengraphen den State-of-the-Art bei der automatischen Extraktion von Straßennetzen aus Satellitenbildern erreicht.

Zhengyang Wei, Renzhi Jing, Yiyi He + 1 more2026-02-27💻 cs

PGVMS: A Prompt-Guided Unified Framework for Virtual Multiplex IHC Staining with Pathological Semantic Learning

Die Arbeit stellt PGVMS vor, ein promptgesteuertes, einheitliches Framework, das mithilfe von drei innovativen Strategien – adaptiver Prompt-Steuerung, proteinbewusstem Lernen und prototypenkonsistentem Lernen – virtuelle multiplexe IHC-Färbungen aus H&E-Bildern unter Verwendung von Uniplex-Trainingsdaten erzeugt und dabei semantische Leitlinien, Verteilungskonsistenz und räumliche Ausrichtung verbessert.

Fuqiang Chen, Ranran Zhang, Wanming Hu + 6 more2026-02-27💻 cs

ManifoldGD: Training-Free Hierarchical Manifold Guidance for Diffusion-Based Dataset Distillation

Der Artikel stellt ManifoldGD vor, ein trainingsfreies Framework für die Datensatz-Distillation, das durch hierarchische Clustering-basierte IPCs und eine manigfaltigkeitskonsistente Guidance in Diffusionsmodellen kompakte, aber informationsreiche Datensätze erzeugt, die sowohl die semantische Vielfalt als auch die Bildqualität verbessern.

Ayush Roy, Wei-Yang Alex Lee, Rudrasis Chakraborty + 1 more2026-02-27🤖 cs.LG