SceneTransporter: Optimal Transport-Guided Compositional Latent Diffusion for Single-Image Structured 3D Scene Generation

Das Paper stellt SceneTransporter vor, ein Framework, das mittels optimaler Transportführung in einem zusammengesetzten latenten Diffusionsmodell aus einem einzelnen Bild strukturierte 3D-Szenen erzeugt, indem es durch exklusive Zuordnungen und konkurrierende Gruppierung die Instanzkohärenz und geometrische Treue in offenen Welten verbessert.

Ling Wang, Hao-Xiang Guo, Xinzhou Wang + 9 more2026-02-27💻 cs

Moral Preferences of LLMs Under Directed Contextual Influence

Die Studie zeigt, dass gerichtete kontextuelle Einflüsse die moralischen Entscheidungen von Sprachmodellen in Trolley-Problem-Szenarien signifikant verändern können, wobei diese Verschiebungen oft nicht durch die Basispräferenzen vorhergesagt werden und durch Reasoning zwar die durchschnittliche Empfindlichkeit verringert, aber die Wirkung verzerrter Few-Shot-Beispiele verstärkt wird.

Phil Blandfort, Tushar Karayil, Urja Pawar + 3 more2026-02-27💬 cs.CL

From Blind Spots to Gains: Diagnostic-Driven Iterative Training for Large Multimodal Models

Die Arbeit stellt DPE (Diagnostic-driven Progressive Evolution) vor, einen iterativen Trainingsansatz für große multimodale Modelle, der durch eine spiralförmige Schleife aus Diagnose, gezieltem Daten-Generierung und Verstärkung statische Trainingsgrenzen überwindet und stabile Leistungssteigerungen über diverse Benchmarks hinweg erzielt.

Hongrui Jia, Chaoya Jiang, Shikun Zhang + 1 more2026-02-27💻 cs

SO3UFormer: Learning Intrinsic Spherical Features for Rotation-Robust Panoramic Segmentation

Das Paper stellt SO3UFormer vor, einen rotation-robusten Architekturansatz für die semantische Segmentierung von Panoramen, der durch intrinsische sphärische Merkmale und geometrisch konsistente Mechanismen die Abhängigkeit von der Ausrichtung überwindet und damit unter beliebigen 3D-Rotationen eine deutlich höhere Stabilität als bestehende State-of-the-Art-Modelle erreicht.

Qinfeng Zhu, Yunxi Jiang, Lei Fan2026-02-27💻 cs

Chain of Flow: A Foundational Generative Framework for ECG-to-4D Cardiac Digital Twins

Die Arbeit stellt Chain of Flow (COF) vor, ein grundlegendes generatives Framework, das aus einzelnen EKG-Signalen individualisierte 4D-Herz-Zwillinge rekonstruiert und diese damit von reinen Vorhersagemodellen zu vollständig manipulierbaren, patientenspezifischen virtuellen Herzen für eine breite Palette klinischer Simulationen weiterentwickelt.

Haofan Wu, Nay Aung, Theodoros N. Arvanitis + 3 more2026-02-27💻 cs

OSDaR-AR: Enhancing Railway Perception Datasets via Multi-modal Augmented Reality

Diese Arbeit stellt den OSDaR-AR-Datensatz vor, der durch ein neuartiges Multi-Modal-Augmented-Reality-Framework mit Unreal Engine 5 photorealistische virtuelle Objekte präzise in reale Eisenbahnsequenzen integriert, um die Lücke zwischen Simulation und Realität zu schließen und die Entwicklung sicherheitskritischer Wahrnehmungssysteme zu fördern.

Federico Nesti, Gianluca D'Amico, Mauro Marinoni + 1 more2026-02-27💻 cs