Large-scale Photorealistic Outdoor 3D Scene Reconstruction from UAV Imagery Using Gaussian Splatting Techniques

Diese Studie stellt eine effiziente End-to-End-Pipeline vor, die UAV-Videoströme durch die Integration von 3D-Gaussian-Splatting-Techniken in Echtzeit in fotorealistische 3D-Szenen umwandelt und dabei im Vergleich zu NeRF-Ansätzen eine deutlich geringere Latenz bei hoher visueller Qualität für AR/VR-Anwendungen bietet.

Christos Maikos, Georgios Angelidis, Georgios Th. Papadopoulos2026-02-25💻 cs

BiRQA: Bidirectional Robust Quality Assessment for Images

Das Paper stellt BiRQA vor, einen kompakten und robusten Full-Reference-Bildqualitäts-Assessments-Algorithmus, der durch bidirektionale Multiskalen-Verarbeitung und eine neuartige „Anchored Adversarial Training"-Methode sowohl in der Genauigkeit als auch in der Geschwindigkeit und Widerstandsfähigkeit gegen Adversarial Attacks den aktuellen Stand der Technik übertrifft.

Aleksandr Gushchin, Dmitriy S. Vatolin, Anastasia Antsiferova2026-02-25💻 cs

Aesthetic Camera Viewpoint Suggestion with 3D Aesthetic Field

Diese Arbeit stellt einen neuen Ansatz vor, der mithilfe eines 3D-Gaussian-Splatting-Netzwerks, das aus einem vortrainierten 2D-Ästhetikmodell gelernt hat, einen geometrieuntermauerten „3D-Ästhetikfeld" aufbaut, um aus wenigen Aufnahmen effizient ästhetisch ansprechende Kameraperspektiven zu bestimmen und dabei kostspielige Reinforcement-Learning-Suchen sowie dichte 3D-Erfassungen zu vermeiden.

Sheyang Tang, Armin Shafiee Sarvestani, Jialu Xu + 2 more2026-02-25💻 cs

SceMoS: Scene-Aware 3D Human Motion Synthesis by Planning with Geometry-Grounded Tokens

Das Paper stellt SceMoS vor, ein effizientes Framework zur textgesteuerten Synthese von 3D-Mensch-Bewegungen in realistischen Umgebungen, das globale Planung und lokale Ausführung durch die Nutzung von 2D-Bildern (Vogelperspektive und Höhenkarten) statt rechenintensiver 3D-Daten entkoppelt und dabei einen neuen State-of-the-Art in Realismus und Kollisionsvermeidung erreicht.

Anindita Ghosh, Vladislav Golyanik, Taku Komura + 3 more2026-02-25💻 cs

Pip-Stereo: Progressive Iterations Pruner for Iterative Optimization based Stereo Matching

Die Arbeit stellt Pip-Stereo vor, ein Echtzeit-Stereo-Matching-System für Edge-Geräte, das durch progressive Iterationspruning, einen kollaborativen monokularen Prior-Transfer und den hardwareoptimierten FlashGRU-Operator die Rechenlast iterativer RNN-basierter Modelle drastisch reduziert und dabei hohe Genauigkeit mit extrem niedriger Latenz vereint.

Jintu Zheng, Qizhe Liu, HuangXin Xu + 1 more2026-02-25💻 cs

Strategy-Supervised Autonomous Laparoscopic Camera Control via Event-Driven Graph Mining

Die Studie stellt ein interpretierbares, ereignisgesteuertes Framework für die autonome laparoskopische Kamerasteuerung vor, das durch Graph-Mining abgeleitete chirurgische Strategien mit einem Vision-Language-Modell und einem sicheren Closed-Loop-Controller kombiniert, um in Experimenten eine signifikant stabilere und präzisere Bildführung als bei Chirurgen in Ausbildung zu erreichen.

Keyu Zhou, Peisen Xu, Yahao Wu + 3 more2026-02-25💻 cs