Gabor Primitives for Accelerated Cardiac Cine MRI Reconstruction

Die vorgestellte Arbeit schlägt Gabor-Primitiven vor, die durch Modulation von Gaußschen Hüllkurven mit komplexen Exponentialfunktionen eine effiziente und physikalisch interpretierbare Rekonstruktion von beschleunigter kardialer Cine-MRT aus stark unterabgetasteten Daten ermöglichen und dabei sowohl glatte Strukturen als auch scharfe Kanten besser darstellen als bestehende Methoden.

Wenqi Huang, Veronika Spieker, Nil Stolt-Ansó, Natascha Niessen, Maik Dannecker, Sevgi Gokce Kafali, Sila Kurugol, Julia A. Schnabel, Daniel Rueckert2026-03-09💻 cs

Longitudinal Lesion Inpainting in Brain MRI via 3D Region Aware Diffusion

Die Studie stellt ein neuartiges, auf Denoising Diffusion Probabilistic Models basierendes Framework vor, das durch die Erweiterung von Region-Aware Diffusion und die Nutzung longitudinaler Kontextinformationen effizient und präzise Läsionen in 3D-MRT-Aufnahmen des Gehirns rekonstruiert, wodurch die Bildqualität verbessert und die Verarbeitungszeit im Vergleich zu bestehenden Methoden um das Zehnfache reduziert wird.

Zahra Karimaghaloo, Dumitru Fetco, Haz-Edine Assemlal, Hassan Rivaz, Douglas L. Arnold2026-03-09🤖 cs.AI

MultiHaystack: Benchmarking Multimodal Retrieval and Reasoning over 40K Images, Videos, and Documents

Das Paper stellt MultiHaystack vor, einen neuen Benchmark mit über 46.000 multimodalen Kandidaten und 747 Fragen, der zeigt, dass die Leistung von Multimodal Large Language Models bei der Kombination aus Retrieval und Reasoning in großen, heterogenen Korpora erheblich unter den Ergebnissen liegt, die bei Bereitstellung der korrekten Beweise erzielt werden.

Dannong Xu, Zhongyu Yang, Jun Chen, Yingfang Yuan, Ming Hu, Lei Sun, Luc Van Gool, Danda Pani Paudel, Chun-Mei Feng2026-03-09💻 cs

Interpretable Perception and Reasoning for Audiovisual Geolocation

Diese Arbeit stellt einen neuartigen Rahmen für die audiovisuelle Geolokalisierung vor, der durch die Zerlegung von Audio in semantische "akustische Atome" und deren multimodale Reasoning-Integration mit visuellen Merkmalen die globale Positionsbestimmung präzisiert und dabei einen neuen Benchmark sowie einen dreistufigen Ansatz mit interpretierbarer Wahrnehmung und Riemannscher Flow-Matching-Vorhersage einführt.

Yiyang Su, Xiaoming Liu2026-03-09💻 cs

Any to Full: Prompting Depth Anything for Depth Completion in One Stage

Das Paper stellt Any2Full vor, ein einstufiges, domainspezifisches Framework, das vortrainierte monokulare Tiefenschätzmodelle durch einen skalabewussten Prompt-Encoder anpasst, um aus unvollständigen Tiefendaten präzise und dichte Tiefenkarten zu generieren und dabei sowohl Recheneffizienz als auch Robustheit gegenüber verschiedenen Sparsity-Mustern zu verbessern.

Zhiyuan Zhou, Ruofeng Liu, Taichi Liu, Weijian Zuo, Shanshan Wang, Zhiqing Hong, Desheng Zhang2026-03-09💻 cs

Layer-wise Instance Binding for Regional and Occlusion Control in Text-to-Image Diffusion Transformers

Das Paper stellt LayerBind vor, eine trainingsfreie und plug-and-play-Methode für Diffusion Transformer, die durch eine zweiphasige, schichtbasierte Instanzbindung präzise regionale Steuerung und die Kontrolle von Okklusionsreihenfolgen in der Text-zu-Bild-Generierung ermöglicht.

Ruidong Chen, Yancheng Bai, Xuanpu Zhang, Jianhao Zeng, Lanjun Wang, Dan Song, Lei Sun, Xiangxiang Chu, Anan Liu2026-03-09💻 cs

Spectral Probing of Feature Upsamplers in 2D-to-3D Scene Reconstruction

Die Studie zeigt, dass für die 2D-zu-3D-Rekonstruktion die Erhaltung der spektralen Struktur durch Upsampler entscheidender ist als die bloße Verbesserung räumlicher Details, wobei ein neu entwickelter diagnostischer Rahmen mit sechs Metriken aufzeigt, dass strukturelle spektrale Konsistenz die Qualität der Neuen View Synthese am besten vorhersagt.

Ling Xiao, Yuliang Xiu, Yue Chen, Guoming Wang, Toshihiko Yamasaki2026-03-09💻 cs

Architectural Unification for Polarimetric Imaging Across Multiple Degradations

Die Arbeit stellt ein einheitliches Architektur-Framework für die polarimetrische Bildgebung vor, das durch eine einzelne Verarbeitungsstufe und die gleichzeitige Bild- und Stokes-Domänen-Bearbeitung physikalische Konsistenz gewährleistet und damit bei verschiedenen Degradationen wie Rauschen, Bewegungsunschärfe und Mosaikartefakten state-of-the-art Ergebnisse erzielt.

Chu Zhou, Yufei Han, Junda Liao, Linrui Dai, Wangze Xu, Art Subpa-Asa, Heng Guo, Boxin Shi, Imari Sato2026-03-09💻 cs