Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

Questo studio presenta un framework di deep learning basato su una GAN con penalità di varianza che trasforma immagini istologiche H&E in immagini IHC ad alta fedeltà per la valutazione precisa dell'HER2 nel cancro al seno, superando le prestazioni dei modelli esistenti e offrendo un'alternativa economica e scalabile alla diagnostica tradizionale.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung NamTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Questo studio presenta TransUNet-GradCAM, un modello ibrido Transformer-U-Net che combina meccanismi di attenzione globale e locali per ottenere un'accurata segmentazione e visualizzazione spiegabile delle ulcere diabetiche del piede, dimostrando elevate prestazioni e robusta trasferibilità su dataset clinici esterni senza necessità di riaddestramento.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Il paper introduce PANO, un operatore neurale fisico-consapevole che esegue un'inversione diretta in un singolo passaggio per la tomografia fotoacustica 3D, superando i metodi tradizionali e permettendo ricostruzioni di alta qualità da acquisizioni sparse in tempo reale.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Questo articolo presenta un approccio innovativo basato su tecniche di Structure-from-Motion e segmentazione 3D che permette di ricostruire e analizzare la forma e le dimensioni degli aggregati direttamente dalle foto o video acquisiti con dispositivi mobili, offrendo una soluzione economica e pratica per il controllo qualità in cantiere.

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Il paper propone un framework di riconoscimento del parlato audiovisivo (AVSR) per scenari privi di risorse, che utilizza stream visivi sintetici generati tramite sincronizzazione labiale su immagini statiche per addestrare modelli su lingue come il catalano, ottenendo prestazioni vicine allo stato dell'arte e superiori ai baselines audio-only.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Questo articolo presenta un approccio basato sul deep learning che utilizza una rete neurale convoluzionale e un autoencoder denoising per segmentare con alta accuratezza la retina e rilevare i distacchi dell'epitelio pigmentoso in immagini OCT a basso costo destinate all'autosorveglianza domiciliare della degenerazione maculare legata all'età.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Il paper propone il metodo ibrido 3D-PIUNet, che migliora la ricostruzione delle sorgenti cerebrali EEG integrando una stima iniziale basata sulla fisica con una rete neurale 3D U-Net per affinare la soluzione, ottenendo una maggiore accuratezza spaziale rispetto ai metodi tradizionali e puramente data-driven.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Questo articolo propone un nuovo approccio per la fusione di immagini in pochi esempi che, sfruttando i "priors granulari" (incompleti) calcolati tramite l'algoritmo GBPC e un'adattiva funzione di perdita, permette a una rete neurale leggera di apprendere regole di fusione efficaci senza bisogno di immagini fuse reali come supervisione.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Il paper presenta PanSubNet, un framework di deep learning interpretabile che, analizzando direttamente le istologie standard H&E, predice i sottotipi molecolari clinicamente rilevanti del carcinoma pancreatico con alta accuratezza e valore prognostico, offrendo un'alternativa rapida ed economica ai costosi test genomici.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

Il paper introduce GOUHFI 2.0, un nuovo toolbox di deep learning che, grazie a una strategia di randomizzazione del dominio e a due reti 3D U-Net addestrate su dati eterogenei, risolve le sfide della segmentazione cerebrale e della parcellizzazione corticale a risoluzione ultra-alta (UHF-MRI), offrendo per la prima volta una soluzione robusta e automatizzata per l'analisi volumetrica in questo contesto.

Marc-Antoine Fortin, Anne Louise Kristoffersen, Paal Erik GoaThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Questo articolo propone un sistema di trasmissione semantica adattivo per comunicazioni satellitari che, sfruttando un'architettura generativa multimodale e un modulo decisionale basato su modelli linguistici, garantisce una ricostruzione audiovisiva sincronizzata ad alta fedeltà riducendo il consumo di banda e migliorando la robustezza in condizioni di canale variabili.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

Il paper presenta DINR, un nuovo framework di inversione tomografica che combina rappresentazioni neurali implicite con un prior generativo basato su diffusione per ottenere ricostruzioni 3D ad alta qualità di dati di tomografia a neutroni da viste sparse, superando le limitazioni dei metodi tradizionali anche in condizioni di dati estremamente ridotti.

Maliha Hossain, Haley Duba-Sullivan, Amirkoushyar ZiabariThu, 12 Ma⚡ eess

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Il paper presenta ECLARE, un metodo di super-risoluzione efficiente e auto-apprendente che migliora la risoluzione anisotropa dei volumi MR clinici stimando il profilo della slice e apprendendo direttamente dai dati acquisiti, superando così le limitazioni delle tecniche esistenti senza subire problemi di spostamento di dominio.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs