DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Ce papier présente DeepSparse, un modèle fondation innovant pour la reconstruction CBCT à vues éparses, qui intègre une architecture DiCE et une stratégie de préentraînement HyViP pour surmonter les limites des méthodes existantes en matière de qualité d'image, de généralisation et de coût computationnel, permettant ainsi une imagerie médicale plus sûre et efficace.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Cette étude présente TransUNet-GradCAM, un modèle hybride combinant Transformers et U-Net qui, grâce à son mécanisme d'attention globale et à ses visualisations explicatives, réalise une segmentation précise et généralisable des ulcères diabétiques du pied sur plusieurs jeux de données cliniques.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Ce papier présente PANO, un opérateur neuronal physique-aware capable d'inverser directement les mesures brutes en images 3D de tomographie photoacoustique avec une haute précision et en temps réel, surpassant les méthodes traditionnelles et facilitant ainsi le passage vers des systèmes cliniques accessibles.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Cet article présente une méthode innovante utilisant la photogrammétrie par mouvement de structure (SfM) et des algorithmes de segmentation 3D sur des images mobiles pour reconstruire et analyser la taille et la forme des granulats dans les stockpiles, offrant ainsi un outil potentiel pour le contrôle qualité sur chantier.

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Ce papier propose un cadre d'apprentissage de la reconnaissance audiovisuelle de la parole pour des langues sans ressources, en générant des flux visuels synthétiques par synchronisation labiale d'images statiques avec de l'audio réel, permettant d'entraîner un modèle performant sur le catalan sans corpus vidéo annoté.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Cet article présente une approche d'apprentissage profond combinant un réseau de neurones convolutifs et un autoencodeur débruiteur pour segmenter avec précision la rétine et détecter les décollements de l'épithélium pigmentaire dans des images OCT à faible coût destinées à l'autosurveillance de la dégénérescence maculaire liée à l'âge.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Cet article propose une nouvelle approche de fusion d'images en peu d'exemples qui introduit le concept de priors incomplets et un algorithme de calcul de granules de pixels (GBPC) pour permettre à un réseau de neurones léger d'apprendre des règles de fusion adaptatives sans nécessiter de véritables images de référence.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Le cadre d'apprentissage profond interprétable PanSubNet permet de prédire directement les sous-types moléculaires cliniquement pertinents du cancer du pancréas à partir de lames histologiques standard H&E, offrant ainsi une alternative rapide, peu coûteuse et généralisable aux tests génomiques pour la stratification des patients.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Cet article propose un système de transmission sémantique multimodale adaptatif pour les communications satellitaires, qui optimise la reconstruction audiovisuelle synchronisée sous contraintes de bande passante en utilisant une architecture générative à double flux et un module de décision basé sur les grands modèles de langage pour ajuster dynamiquement les flux de transmission en fonction des conditions du canal.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

Ce papier présente DINR, un cadre d'inversion par tomographie computationnelle utilisant des priors de diffusion pour régulariser des représentations neuronales implicites, permettant ainsi des reconstructions 3D de haute qualité à partir de données de tomographie neutronique à vues éparses, même sur des structures de béton réelles.

Maliha Hossain, Haley Duba-Sullivan, Amirkoushyar ZiabariThu, 12 Ma⚡ eess

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Le papier présente ECLARE, une méthode d'apprentissage croisé planaire efficace qui améliore la résolution anisotrope des volumes IRM cliniques en estimant le profil de coupe et en apprenant directement à partir des données d'acquisition pour surmonter les limitations des méthodes précédentes, notamment le décalage de domaine et les facteurs de suréchantillonnage arbitraires.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs