Axial-Centric Cross-Plane Attention for 3D Medical Image Classification

Diese Arbeit stellt eine axial-zentrische Cross-Plane-Attention-Architektur vor, die den klinischen Interpretationsablauf nachahmt, indem sie ein auf axialen CT-Bildern vortrainiertes MedDINOv3-Modell mit speziellen Aufmerksamkeitsmechanismen kombiniert, um die diagnostische Genauigkeit bei der Klassifizierung von 3D-Medizinbildern im Vergleich zu bestehenden Methoden signifikant zu steigern.

Doyoung Park, Jinsoo Kim, Lohendran Baskaran2026-02-26💻 cs

Lie Flow: Video Dynamic Fields Modeling and Predicting with Lie Algebra as Geometric Physics Principle

Die Arbeit stellt LieFlow vor, ein Framework zur Modellierung dynamischer 4D-Szenen, das mithilfe der Lie-Algebra und der SE(3)-Gruppe eine physikalisch konsistente und geometrisch kohärente Darstellung von Translationen und Rotationen ermöglicht, wodurch die Bildsynthesequalität und zeitliche Kohärenz im Vergleich zu bestehenden NeRF-basierten Ansätzen erheblich verbessert wird.

Weidong Qiao, Wangmeng Zuo, Hui Li2026-02-26💻 cs

HybridINR-PCGC: Hybrid Lossless Point Cloud Geometry Compression Bridging Pretrained Model and Implicit Neural Representation

Die Arbeit stellt HybridINR-PCGC vor, ein neuartiges hybrides Framework für die verlustfreie Kompression von Punktwolken, das die Stärken vortrainierter Modelle und impliziter neuronaler Repräsentationen kombiniert, um die Trainingsabhängigkeit zu überwinden, die Konvergenz zu beschleunigen und gleichzeitig eine signifikante Verbesserung der Kompressionsrate und Kodierungseffizienz zu erzielen.

Wenjie Huang, Qi Yang, Shuting Xia + 3 more2026-02-26💻 cs

Dynamic Multimodal Activation Steering for Hallucination Mitigation in Large Vision-Language Models

Die vorgestellte Arbeit stellt eine trainingsfreie Methode namens Dynamic Multimodal Activation Steering vor, die durch die dynamische, kontextabhängige Steuerung spezifischer Aufmerksamkeitsköpfe auf Basis von Wahrnehmungs- und Wahrheitsvektoren Halluzinationen in Large Vision-Language Models effektiv reduziert und dabei den aktuellen Stand der Technik übertrifft.

Jianghao Yin, Qin Chen, Kedi Chen + 3 more2026-02-26🤖 cs.AI

Learning spatially adaptive sparsity level maps for arbitrary convolutional dictionaries

Die vorgestellte Methode erweitert einen modellbasierten Rekonstruktionsansatz für Bildgebung, indem sie ein neuronales Netzwerk nutzt, um räumlich adaptive Sparsity-Level-Karten für beliebige Faltungs-Dictionaries zu lernen, was zu verbesserter Interpretierbarkeit, Filter-Permutations-Invarianz und größerer Robustheit gegenüber Datenverteilungsverschiebungen im Vergleich zu reinen Black-Box-Methoden führt.

Joshua Schulz, David Schote, Christoph Kolbitsch + 2 more2026-02-26⚡ eess

Assessing airborne laser scanning and aerial photogrammetry for deep learning-based stand delineation

Die Studie zeigt, dass ein auf Deep Learning basierendes Framework zur Waldbestandsabgrenzung sowohl mit ALS- als auch mit photogrammetrisch abgeleiteten Daten vergleichbar hohe Genauigkeiten erreicht und somit die Nutzung zeitlich abgestimmter, kosteneffizienter DAP-Daten für die Erstellung großer Trainingsdatensätze ermöglicht.

Håkon Næss Sandum, Hans Ole Ørka, Oliver Tomic + 1 more2026-02-26💻 cs

Innovative Tooth Segmentation Using Hierarchical Features and Bidirectional Sequence Modeling

Diese Arbeit stellt ein innovatives Verfahren zur Zahnssegmentierung vor, das durch einen dreistufigen Encoder mit hierarchischen Merkmalen und bidirektionale Sequenzmodellierung die Kontextwahrnehmung verbessert und gleichzeitig den rechenintensiven Overhead von Transformer-Architekturen vermeidet, was auf dem OralVision-Datensatz zu einer signifikanten Steigerung der Genauigkeit führt.

Xinxin Zhao, Jian Jiang, Yan Tian + 5 more2026-02-26💻 cs

LiREC-Net: A Target-Free and Learning-Based Network for LiDAR, RGB, and Event Calibration

Die Arbeit stellt LiREC-Net vor, ein zielloses, lernbasiertes Netzwerk, das im Gegensatz zu bestehenden bi-modalen Ansätzen LiDAR-, RGB- und Event-Daten in einem einheitlichen Framework gemeinsam kalibriert und dabei eine effiziente, geteilte LiDAR-Repräsentation nutzt, um eine präzise Multi-Sensor-Fusion für autonome Systeme zu ermöglichen.

Aditya Ranjan Dash, Ramy Battrawy, René Schuster + 1 more2026-02-26💻 cs

SAPNet++: Evolving Point-Prompted Instance Segmentation with Semantic and Spatial Awareness

Die Arbeit stellt SAPNet++ vor, ein Netzwerk zur instanzbasierten Segmentierung mit einzelnen Punkthinweisen, das durch semantische und räumliche Bewusstheit sowie neue Module wie S-MIL und Multi-level Affinity Refinement die Herausforderungen von Granularitätsambiguität und Grenzunsicherheit löst und die Segmentierungsleistung auf vier Datensätzen signifikant verbessert.

Zhaoyang Wei, Xumeng Han, Xuehui Yu + 4 more2026-02-26💻 cs