DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Die Studie stellt DeepSparse, das erste Foundation-Modell für die Rekonstruktion von Sparse-View-CBCT-Bildern, vor, das durch die innovative DiCE-Netzwerkarchitektur und das HyViP-Vorabtrainingsframework eine überlegene Bildqualität bei reduzierter Strahlenbelastung und verbesserter Generalisierbarkeit im Vergleich zu bestehenden Methoden erreicht.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Diese Studie stellt TransUNet-GradCAM vor, einen hybriden Transformer-U-Net-Ansatz mit Selbstattention und erklärbarer Visualisierung, der durch die Integration globaler Kontextinformationen und lokaler Details eine robuste und generalisierbare Segmentierung von diabetischen Fußulzera ermöglicht.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Die Studie stellt PANO vor, einen physikbewussten neuronalen Operator, der die direkte Umkehrung von Rohdaten zu 3D-Bildern in der photoakustischen Tomographie ermöglicht und dabei die Rekonstruktionsqualität sowie die Echtzeitfähigkeit im Vergleich zu herkömmlichen Methoden erheblich verbessert.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

CryoNet.Refine ist ein auf einem einstufigen Diffusionsmodell basierendes Deep-Learning-Framework, das die automatische und schnelle Verfeinerung von Protein- sowie DNA/RNA-Protein-Komplexen mittels Cryo-EM-Dichtekarten ermöglicht und dabei sowohl die Übereinstimmung mit den experimentellen Daten als auch die geometrische Qualität gegenüber herkömmlichen Methoden wie Phenix.real_space_refine signifikant verbessert.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff ZhangTue, 10 Ma💻 cs

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Diese Studie stellt einen innovativen 3D-Bildgebungsansatz vor, der Structure-from-Motion-Techniken und mobile Endgeräte nutzt, um aus Videos von Aggregat-Deponien eine dreidimensionale Rekonstruktion zu erstellen und einzelne Körner zu segmentieren, um so deren Größe und Form für die Vor-Ort-Qualitätssicherung in der Straßenbauindustrie zu analysieren.

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Die vorgestellte Studie demonstriert, dass ein Framework zur Audiovisuellen Spracherkennung für ressourcenarme Sprachen durch die Generierung synthetischer Videodaten mittels Lip-Syncing realer Audioaufnahmen mit statischen Gesichtsbildern erfolgreich bootstrapped werden kann, was in einer Anwendung auf Katalanisch zu einer nahezu state-of-the-art Leistung führt.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Diese Studie stellt erstmals eine Deep-Learning-Methode vor, die mithilfe eines CNN und eines CDAE zur Nachbearbeitung retinale OCT-Bilder eines kostengünstigen Selbstuntersuchungsgeräts segmentiert, wobei zwar die Gesamtretna präzise, die Detektion von pigmentepithelialen Ablösungen jedoch herausfordernd ist.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Die Studie stellt 3D-PIUNet vor, eine hybride Methode zur EEG-Quellenlokalisation, die physikalische Inverslösungen zur Initialisierung mit einem 3D-Convolutional-U-Net kombiniert, um die räumliche Genauigkeit der Gehirnquellen-Rekonstruktion sowohl bei simulierten als auch bei realen Daten signifikant zu verbessern.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Die Studie stellt PanSubNet vor, ein interpretierbares Deep-Learning-Framework, das aus routinemäßigen H&E-gefärbten Gewebeschnitten molekulare Subtypen des Pankreaskarzinoms (basal-ähnlich und klassisch) mit hoher Genauigkeit vorhersagt und somit eine kosteneffiziente, schnelle und klinisch anwendbare Alternative zu teuren Genexpressionsanalysen bietet.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

Das Paper stellt GOUHFI 2.0 vor, ein aktualisiertes Deep-Learning-Toolbox für die robuste Segmentierung, kortikale Parzellierung und Volumetrie von Gehirn-MRT-Daten bei Ultra-Hochfeld-Stärken, das durch erweiterte Trainingsdaten und eine kontrast- sowie auflösungsunabhängige Architektur die Grenzen bestehender Software überwindet.

Marc-Antoine Fortin, Anne Louise Kristoffersen, Paal Erik GoaThu, 12 Ma⚡ eess

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Die Arbeit stellt ARCHE vor, ein effizientes, auf End-to-End-Lernen basierendes Bildkompressionsframework, das durch die Kombination von hierarchischen, räumlichen und kanalbasierten Priors sowie adaptiver Merkmalsneujustierung ohne rekurrente oder Transformer-Komponenten einen neuen State-of-the-Art in der Rate-Distortion-Leistung bei gleichzeitig hoher Recheneffizienz erreicht.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios SkodrasThu, 12 Ma⚡ eess

An FPGA Implementation of Displacement Vector Search for Intra Pattern Copy in JPEG XS

Diese Arbeit stellt eine effiziente, pipelinierte FPGA-Architektur für die Verschiebungsvektorsuche im Intra-Pattern-Copy-Modul von JPEG XS vor, die durch optimierte Speicherorganisation eine hohe Durchsatzrate von 38,3 Megapixeln pro Sekunde bei geringem Energieverbrauch erreicht und somit die praktische Hardware-Implementierung ermöglicht.

Qiyue Chen, Yao Li, Jie Tao, Song Chen, Li Li, Dong LiuThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Dieser Artikel stellt ein adaptives semantisches Satellitenkommunikationssystem vor, das mithilfe einer dualen generativen Architektur und einer KI-gesteuerten Entscheidungsfindung die Bandbreite optimiert, indem es dynamisch zwischen Video- und Audio-gesteuerter Generierung wechselt, um auch unter schwierigen Kanalbedingungen eine hochwertige synchronisierte audiovisuelle Rekonstruktion zu gewährleisten.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

Die Autoren stellen einen neuen Framework namens Diffusive INR (DINR) vor, der generative Diffusions-Priors mit impliziten neuronalen Darstellungen kombiniert, um aus spärlichen Neutronen-CT-Daten hochwertige 3D-Rekonstruktionen von Betonmikrostrukturen zu ermöglichen und dabei herkömmliche Methoden in Bezug auf Bildqualität und Artefaktreduktion zu übertreffen.

Maliha Hossain, Haley Duba-Sullivan, Amirkoushyar ZiabariThu, 12 Ma⚡ eess

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Der Artikel stellt ECLARE vor, eine effiziente selbstüberwachte Methode zur anisotropen Auflösungssteigerung von 2D-MRT-Schichtbildern, die durch die Schätzung des Schichtprofils und das Lernen innerhalb derselben Volumina Interpolationsfehler, Domänenverschiebungen und Lücken zwischen den Schichten überwindet und dabei alle aktuellen Methoden in der Signalwiederherstellung sowie bei nachgelagerten Aufgaben übertrifft.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs