Measurement-Consistent Langevin Corrector for Stabilizing Latent Diffusion Inverse Problem Solvers

Die Arbeit stellt den „Measurement-Consistent Langevin Corrector" (MCLC) vor, einen theoretisch fundierten Plug-and-Play-Modul, der die Instabilität latenter Diffusionslösungsansätze für inverse Probleme durch messungskonsistente Langevin-Aktualisierungen behebt und so eine stabilere und zuverlässigere Lösung im latenten Raum ermöglicht.

Lee Hyoseok, Sohwi Lim, Eunju Cha + 1 more2026-03-05🤖 cs.LG

3D Wavelet-Based Structural Priors for Controlled Diffusion in Whole-Body Low-Dose PET Denoising

Die Studie stellt WCC-Net vor, ein vollständig 3D-diffusionsbasiertes Framework, das durch die Integration von Wavelet-basierten strukturellen Priors in einen vortrainierten Diffusionsbackbone die Rauschunterdrückung bei Ganzkörper-PET-Aufnahmen mit niedriger Dosis verbessert und dabei gleichzeitig die anatomische Konsistenz und die Bildqualität über verschiedene Dosislevel hinweg signifikant steigert.

Peiyuan Jing, Yue Yang, Chun-Wun Cheng + 8 more2026-03-05🤖 cs.AI

Tracing 3D Anatomy in 2D Strokes: A Multi-Stage Projection Driven Approach to Cervical Spine Fracture Identification

Diese Studie stellt einen mehrstufigen, projektionsbasierten Ansatz vor, der durch die Fusion von 2D-Segmentierungen geschätzte 3D-Masken zur Extraktion von Halswirbel-Volumen nutzt und anschließend Ensemble-Modelle aus CNNs und Transformern einsetzt, um Halswirbelsäulenfrakturen mit einer diagnostischen Genauigkeit zu identifizieren, die der von Expertenradiologen vergleichbar ist.

Fabi Nahian Madhurja, Rusab Sarmun, Muhammad E. H. Chowdhury + 3 more2026-03-05🤖 cs.AI

Improving Medical Visual Reinforcement Fine-Tuning via Perception and Reasoning Augmentation

Die Arbeit stellt VRFT-Aug vor, ein visuelles Reinforcement-Fine-Tuning-Framework für den medizinischen Bereich, das durch Strategien zur Augmentierung von Wahrnehmung und Schlussfolgerung – wie Wissensinjektion und belohnungsbasiertes Shaping – die Leistung von Modellen bei medizinischen Bildaufgaben im Vergleich zu herkömmlichen Methoden signifikant verbessert.

Guangjing Yang, ZhangYuan Yu, Ziyuan Qin + 7 more2026-03-05🤖 cs.AI

First International StepUP Competition for Biometric Footstep Recognition: Methods, Results and Remaining Challenges

Die erste internationale StepUP-Wettbewerb für biometrische Schritterkennung präsentierte Ergebnisse und Herausforderungen der neuen UNB StepUP-P150-Datenbank, wobei das beste Team mit einer Generative Reward Machine eine Fehlerrate von 10,77 % erreichte, während die Generalisierung auf unbekanntes Schuhwerk als zentrale offene Aufgabe identifiziert wurde.

Robyn Larracy, Eve MacDonald, Angkoon Phinyomark + 5 more2026-03-05🤖 cs.LG

When Safety Collides: Resolving Multi-Category Harmful Conflicts in Text-to-Image Diffusion via Adaptive Safety Guidance

Die Arbeit stellt Conflict-aware Adaptive Safety Guidance (CASG) vor, ein trainingsfreies Framework, das durch die dynamische Identifizierung und gezielte Anwendung sicherheitsrelevanter Richtungen für spezifische Kategorien Konflikte zwischen verschiedenen Schadenskategorien bei Text-zu-Bild-Diffusionsmodellen auflöst und so die schädliche Ausgaberate im Vergleich zu bestehenden Methoden signifikant senkt.

Yongli Xiang, Ziming Hong, Zhaoqing Wang + 3 more2026-03-05💻 cs

Momentum Memory for Knowledge Distillation in Computational Pathology

Die Arbeit stellt Momentum Memory Knowledge Distillation (MoMKD) vor, ein neuartiges Framework zur Wissensdistillation, das durch eine momentum-basierte Speichereinheit und die Entkopplung der Gradienten die Stabilität und Generalisierbarkeit von rein histologischen Krebsdiagnosemodellen verbessert, indem es genomische Supervision effektiv nutzt, ohne auf gepaarte Trainingsdaten angewiesen zu sein.

Yongxin Guo, Hao Lu, Onur C. Koyun + 3 more2026-03-05💻 cs

Automatic Map Density Selection for Locally-Performant Visual Place Recognition

Diese Arbeit stellt einen dynamischen Ansatz zur Visual Place Recognition vor, der automatisch die optimale Karten-Dichte basierend auf benutzerdefinierten Anforderungen an die lokale Trefferquote und die Erreichungsrate bestimmt, um eine zuverlässige Leistung in spezifischen Umgebungsabschnitten zu gewährleisten, ohne unnötige Überdichte zu erzeugen.

Somayeh Hussaini, Tobias Fischer, Michael Milford2026-03-05💻 cs

Beyond Dominant Patches: Spatial Credit Redistribution For Grounded Vision-Language Models

Die Arbeit stellt Spatial Credit Redistribution (SCR) vor, eine gewichtsfreie Inferenzmethode, die durch die Umverteilung von Aktivierungen auf benachbarte Bildpatches die räumliche Kreditkonzentration in Vision-Language-Modellen korrigiert und so Halluzinationen signifikant reduziert, ohne die Generierungsqualität oder Latenz beeinträchtigen.

Niamul Hassan Samin, Md Arifur Rahman, Abdullah Ibne Hanif Arean + 2 more2026-03-05🤖 cs.AI