Geometry-to-Image Synthesis-Driven Generative Point Cloud Registration

Dieser Artikel stellt einen neuartigen Ansatz für die generative Punktwolken-Registrierung vor, der fortschrittliche 2D-Generativmodelle (DepthMatch-ControlNet und LiDARMatch-ControlNet) nutzt, um geometrisch konsistente und texturübergreifend abgestimmte Bildpaare zu synthetisieren, um so die Robustheit der 3D-Matching-Prozesse für Tiefenkamera- und LiDAR-Daten zu verbessern.

Haobo Jiang, Jin Xie, Jian Yang + 2 more2026-02-17💻 cs

X-ray Insights Unleashed: Pioneering the Enhancement of Multi-Label Long-Tail Data

Diese Arbeit stellt eine neuartige Daten-Synthesepipeline vor, die mithilfe eines auf Normalröntgenbildern trainierten Diffusionsmodells, einer Large-Language-Model-Knowledge-Guidance und einer progressiven inkrementellen Lernstrategie seltene Lungenanomalien in der Langschwanzverteilung synthetisch anreichert, um die diagnostische Genauigkeit bei Multi-Label-Daten zu verbessern.

Xinquan Yang, Jinheng Xie, Yawen Huang + 6 more2026-02-17💻 cs

SlimEdge: Performance and Device Aware Distributed DNN Deployment on Resource-Constrained Edge Hardware

Die Arbeit stellt „SlimEdge" vor, einen ressourcenbewussten Ansatz zur effizienten Verteilung von Deep-Learning-Modellen auf leistungsbegrenzten Edge-Geräten, der strukturiertes Pruning mit einer mehrzieloptimierten Strategie kombiniert, um trotz Geräteausfällen hohe Genauigkeit bei deutlich reduzierter Inferenzzeit zu gewährleisten.

Mahadev Sunil Kumar, Arnab Raha, Debayan Das + 3 more2026-02-17💻 cs

ShotFinder: Imagination-Driven Open-Domain Video Shot Retrieval via Web Search

Die Arbeit stellt ShotFinder vor, ein Benchmark und ein dreistufiges Retrieval-System, das auf der „Vorstellungskraft" von Sprachmodellen basiert, um offene Video-Suchanfragen mit komplexen zeitlichen und visuellen Einschränkungen zu bewältigen, wobei Experimente zeigen, dass aktuelle multimodale Modelle hier noch erhebliche Lücken zur menschlichen Leistung aufweisen.

Tao Yu, Haopeng Jin, Hao Wang + 18 more2026-02-17🤖 cs.AI

Deep learning Based Correction Algorithms for 3D Medical Reconstruction in Computed Tomography and Macroscopic Imaging

Diese Arbeit stellt einen hybriden Zwei-Stufen-Registrationsansatz vor, der eine globale geometrische Ausrichtung mit einer tiefenlernbasierten lokalen Verfeinerung kombiniert, um präzise und generalisierbare 3D-Rekonstruktionen von Nieren aus makroskopischen Schnittbildern trotz geringer Datenverfügbarkeit und starker Verzerrungen zu ermöglichen.

Tomasz Les, Tomasz Markiewicz, Malgorzata Lorent + 2 more2026-02-17⚡ eess

Unsupervised MR-US Multimodal Image Registration with Multilevel Correlation Pyramidal Optimization

Die vorgestellte Arbeit stellt eine unüberwachte Methode zur multimodalen Bildregistrierung (MCPO) vor, die mithilfe eines multilevel-Korrelationspyramiden-Optimierungsansatzes Herausforderungen bei der chirurgischen Navigation löst und in den ReMIND2Reg-Wettbewerben von Learn2Reg 2025 sowie auf dem Resect-Datensatz Spitzenleistungen erzielt.

Jiazheng Wang, Zeyu Liu, Min Liu + 4 more2026-02-17💻 cs

Designing Multi-Robot Ground Video Sensemaking with Public Safety Professionals

In Zusammenarbeit mit sechs Polizeibehörden entwickelten die Autoren ein Testfeld und das Tool MRVS, um die praktische Integration von Multi-Robot-Videos in den öffentlichen Sicherheitsbereich zu untersuchen, wobei die Teilnehmer zwar eine Entlastung durch KI-gestützte Erklärungen feststellten, aber auch Bedenken hinsichtlich Fehlalarmen und Datenschutz äußerten.

Puqi Zhou, Ali Asgarov, Aafiya Hussain + 9 more2026-02-17💻 cs