Few-Shot Continual Learning for 3D Brain MRI with Frozen Foundation Models

Die Studie zeigt, dass die Kombination aus einem eingefrorenen 3D-MRI-Grundmodell und aufgaben spezifischen LoRA-Adaptern eine effektive Lösung für das Few-Shot-Continual-Learning darstellt, die durch das Vermeiden von Katastrophischem Vergessen und einen minimalen Trainierparameteranteil eine ausgewogene Leistung bei Tumorsegmentierung und Gehirnalter-Schätzung ermöglicht.

Chi-Sheng Chen, Xinyu Zhang, Guan-Ying Chen + 3 more2026-03-02⚡ eess

Automated Dose-Based Anatomic Region Classification of Radiotherapy Treatment for Big Data Applications

Die Studie stellt einen automatisierten, auf Deep Learning basierenden Algorithmus vor, der durch die Analyse von Dosis-Volumen-Überlappungen an 118 anatomischen Strukturen radiotherapeutische Behandlungspläne zuverlässig in sechs anatomische Regionen klassifiziert und so eine skalierbare Lösung für die Curierung großer, multi-institutioneller Big-Data-Datensätze ohne Abhängigkeit von inkonsistenten Metadaten bietet.

Justin Hink, Yasin Abdulkadir, Jack Neylon + 1 more2026-03-02🔬 physics

BuildAnyPoint: 3D Building Structured Abstraction from Diverse Point Clouds

Die Arbeit stellt BuildAnyPoint vor, ein neuartiges generatives Framework, das mithilfe eines Lose-kaskadierten Diffusions-Transformers (Loca-DiT) und autoregressiver Mesh-Generierung aus unterschiedlichen Punktwolken strukturierte 3D-Gebäudeabstraktionen rekonstruiert und dabei signifikante qualitative sowie quantitative Verbesserungen gegenüber bestehenden Methoden erzielt.

Tongyan Hua, Haoran Gong, Yuan Liu + 3 more2026-03-02💻 cs

Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering

Die vorgestellte Arbeit stellt einen trainingsfreien, Inferenzzeit-Steuerungsansatz namens Semantically Decoupled Latent Steering (SDLS) vor, der durch semantisch entkoppelte, orthogonale Vektoren Halluzinationen bei der automatisierten Generierung von Röntgenbefunden effektiv unterdrückt, ohne dabei die klinische Genauigkeit zu beeinträchtigen.

Ao Li, Rui Liu, Mingjie Li + 6 more2026-03-02💻 cs

HiDrop: Hierarchical Vision Token Reduction in MLLMs via Late Injection, Concave Pyramid Pruning, and Early Exit

Das Paper stellt HiDrop vor, ein Framework für Multimodale Large Language Models, das durch späte Injektion visueller Tokens, konvexe Pyramiden-Pruning mit Early-Exit-Mechanismus und weitere Optimierungen etwa 90 % der visuellen Tokens reduziert und dabei die Leistung beibehält sowie das Training um das 1,72-fache beschleunigt.

Hao Wu, Yingqi Fan, Jinyang Dai + 3 more2026-03-02💬 cs.CL

Can Unified Generation and Understanding Models Maintain Semantic Equivalence Across Different Output Modalities?

Die Studie stellt fest, dass einheitliche multimodale Sprachmodelle zwar über starke textbasierte Schlussfolgerungs- und Bildgenerierungsfähigkeiten verfügen, jedoch an einer signifikanten semantischen Inkonsistenz leiden, wenn sie komplexe Fragen direkt in visuelle Antworten umsetzen müssen, was auf eine mangelnde semantische Ausrichtung zwischen den Modalitäten und nicht auf eine generative Unzulänglichkeit hinweist.

Hongbo Jiang, Jie Li, Yunhang Shen + 4 more2026-03-02💻 cs