eess.IV articles | Gist.Science

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Ce papier présente DeepSparse, un modèle fondation innovant pour la reconstruction CBCT à vues éparses, qui intègre une architecture DiCE et une stratégie de préentraînement HyViP pour surmonter les limites des méthodes existantes en matière de qualité d'image, de généralisation et de coût computationnel, permettant ainsi une imagerie médicale plus sûre et efficace.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

Cette étude propose un cadre d'apprentissage profond basé sur un GAN pénalisé par la variance pour générer des images d'immunohistochimie (IHC) de haute fidélité à partir de coupes histologiques H&E, permettant ainsi une évaluation précise et rentable de l'expression de HER2 dans le cancer du sein.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung NamTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Cette étude présente TransUNet-GradCAM, un modèle hybride combinant Transformers et U-Net qui, grâce à son mécanisme d'attention globale et à ses visualisations explicatives, réalise une segmentation précise et généralisable des ulcères diabétiques du pied sur plusieurs jeux de données cliniques.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Ce papier présente PANO, un opérateur neuronal physique-aware capable d'inverser directement les mesures brutes en images 3D de tomographie photoacoustique avec une haute précision et en temps réel, surpassant les méthodes traditionnelles et facilitant ainsi le passage vers des systèmes cliniques accessibles.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

Le papier présente UltraUPConvNet, un cadre universel et économe en calcul basé sur UPerNet et ConvNeXt, conçu pour réaliser simultanément la segmentation des tissus et la prédiction de maladies dans les images échographiques avec des performances de pointe.

Zhi Chen, Le ZhangTue, 10 Ma💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

CryoNet.Refine est un modèle de diffusion en une étape qui automatise et accélère le raffinement des structures moléculaires à partir de cartes de densité cryo-EM, surpassant les méthodes traditionnelles en termes de rapidité et de qualité géométrique.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff ZhangTue, 10 Ma💻 cs

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Cet article présente une méthode innovante utilisant la photogrammétrie par mouvement de structure (SfM) et des algorithmes de segmentation 3D sur des images mobiles pour reconstruire et analyser la taille et la forme des granulats dans les stockpiles, offrant ainsi un outil potentiel pour le contrôle qualité sur chantier.

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Ce papier propose un cadre d'apprentissage de la reconnaissance audiovisuelle de la parole pour des langues sans ressources, en générant des flux visuels synthétiques par synchronisation labiale d'images statiques avec de l'audio réel, permettant d'entraîner un modèle performant sur le catalan sans corpus vidéo annoté.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Cet article présente une approche d'apprentissage profond combinant un réseau de neurones convolutifs et un autoencodeur débruiteur pour segmenter avec précision la rétine et détecter les décollements de l'épithélium pigmentaire dans des images OCT à faible coût destinées à l'autosurveillance de la dégénérescence maculaire liée à l'âge.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Ce papier présente la méthode hybride 3D-PIUNet, qui améliore la reconstruction des sources cérébrales en EEG en initialisant un réseau de neurones 3D avec une solution physique inverse pour combiner les avantages des approches traditionnelles et de l'apprentissage profond.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Cet article propose une nouvelle approche de fusion d'images en peu d'exemples qui introduit le concept de priors incomplets et un algorithme de calcul de granules de pixels (GBPC) pour permettre à un réseau de neurones léger d'apprendre des règles de fusion adaptatives sans nécessiter de véritables images de référence.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Le cadre d'apprentissage profond interprétable PanSubNet permet de prédire directement les sous-types moléculaires cliniquement pertinents du cancer du pancréas à partir de lames histologiques standard H&E, offrant ainsi une alternative rapide, peu coûteuse et généralisable aux tests génomiques pour la stratification des patients.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

Le papier présente GOUHFI 2.0, une nouvelle boîte à outils de deep learning optimisée pour l'IRM à très haut champ, qui permet une segmentation cérébrale, une parcellisation corticale et une volumétrie robustes grâce à des réseaux 3D U-Net entraînés sur des données variées.

Marc-Antoine Fortin, Anne Louise Kristoffersen, Paal Erik GoaThu, 12 Ma⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

Ce papier présente ZACH-ViT, un Vision Transformer compact sans embeddings de position ni token [CLS] qui, grâce à un traitement invariant par permutation, démontre des performances compétitives en imagerie médicale à faible échantillonnage en adaptant son biais inductif à la structure spatiale des données.

Athanasios AngelakisThu, 12 Ma⚡ eess

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Le papier présente ARCHE, un cadre de compression d'images appris de bout en bout qui allie efficacité de modélisation et performance computationnelle en unifiant des priors hiérarchiques, spatiaux et canalaires sans recourir à des composants récurrents ou transformateurs, atteignant ainsi des résultats de l'état de l'art en taux-distorsion.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios SkodrasThu, 12 Ma⚡ eess

An FPGA Implementation of Displacement Vector Search for Intra Pattern Copy in JPEG XS

Cet article propose une architecture FPGA pipeline optimisée pour la recherche de vecteurs de déplacement dans l'outil de copie de motifs intra (IPC) de JPEG XS, permettant d'atteindre un débit de 38,3 Mpixels/s avec une consommation de 277 mW et facilitant ainsi le déploiement matériel de cette technologie de compression d'images.

Qiyue Chen, Yao Li, Jie Tao, Song Chen, Li Li, Dong LiuThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Cet article propose un système de transmission sémantique multimodale adaptatif pour les communications satellitaires, qui optimise la reconstruction audiovisuelle synchronisée sous contraintes de bande passante en utilisant une architecture générative à double flux et un module de décision basé sur les grands modèles de langage pour ajuster dynamiquement les flux de transmission en fonction des conditions du canal.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

Ce papier présente DINR, un cadre d'inversion par tomographie computationnelle utilisant des priors de diffusion pour régulariser des représentations neuronales implicites, permettant ainsi des reconstructions 3D de haute qualité à partir de données de tomographie neutronique à vues éparses, même sur des structures de béton réelles.

Maliha Hossain, Haley Duba-Sullivan, Amirkoushyar ZiabariThu, 12 Ma⚡ eess

An Efficient Self-supervised Seismic Data Reconstruction Method Based on Self-Consistency Learning

Cet article propose une méthode d'apprentissage auto-supervisé basée sur l'auto-cohérence et un réseau léger pour reconstruire efficacement des données sismiques irrégulières sans nécessiter de jeux de données supplémentaires.

Mingwei Wang, Junheng Peng, Yingtian Liu, Yong LiMon, 09 Ma🤖 cs.LG

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Le papier présente ECLARE, une méthode d'apprentissage croisé planaire efficace qui améliore la résolution anisotrope des volumes IRM cliniques en estimant le profil de coupe et en apprenant directement à partir des données d'acquisition pour surmonter les limitations des méthodes précédentes, notamment le décalage de domaine et les facteurs de suréchantillonnage arbitraires.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

← Précédent Suivant →