eess.IV articoli | Gist.Science

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Il paper presenta DeepSparse, il primo modello fondazionale per la ricostruzione CBCT a viste sparse, che combina l'architettura DiCE e la strategia di pre-addestramento HyViP per ottenere immagini di alta qualità riducendo l'esposizione alle radiazioni e migliorando la generalizzabilità rispetto ai metodi esistenti.

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

Questo studio presenta un framework di deep learning basato su una GAN con penalità di varianza che trasforma immagini istologiche H&E in immagini IHC ad alta fedeltà per la valutazione precisa dell'HER2 nel cancro al seno, superando le prestazioni dei modelli esistenti e offrendo un'alternativa economica e scalabile alla diagnostica tradizionale.

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung NamTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Questo studio presenta TransUNet-GradCAM, un modello ibrido Transformer-U-Net che combina meccanismi di attenzione globale e locali per ottenere un'accurata segmentazione e visualizzazione spiegabile delle ulcere diabetiche del piede, dimostrando elevate prestazioni e robusta trasferibilità su dataset clinici esterni senza necessità di riaddestramento.

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

Il paper introduce PANO, un operatore neurale fisico-consapevole che esegue un'inversione diretta in un singolo passaggio per la tomografia fotoacustica 3D, superando i metodi tradizionali e permettendo ricostruzioni di alta qualità da acquisizioni sparse in tempo reale.

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

Il paper presenta UltraUPConvNet, un framework universale ed efficiente basato su UPerNet e ConvNeXt che, addestrato su un ampio dataset di oltre 9.700 annotazioni, unifica con prestazioni all'avanguardia la segmentazione dei tessuti e la previsione delle malattie nelle immagini ecografiche riducendo al contempo il carico computazionale.

Zhi Chen, Le ZhangTue, 10 Ma💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

Il paper presenta CryoNet.Refine, un modello di diffusione deep learning a un singolo passaggio che automatizza e accelera il raffinamento dei modelli strutturali in mappe di densità Cryo-EM, superando i metodi tradizionali in termini di velocità e qualità geometrica.

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff ZhangTue, 10 Ma💻 cs

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Questo articolo presenta un approccio innovativo basato su tecniche di Structure-from-Motion e segmentazione 3D che permette di ricostruire e analizzare la forma e le dimensioni degli aggregati direttamente dalle foto o video acquisiti con dispositivi mobili, offrendo una soluzione economica e pratica per il controllo qualità in cantiere.

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Il paper propone un framework di riconoscimento del parlato audiovisivo (AVSR) per scenari privi di risorse, che utilizza stream visivi sintetici generati tramite sincronizzazione labiale su immagini statiche per addestrare modelli su lingue come il catalano, ottenendo prestazioni vicine allo stato dell'arte e superiori ai baselines audio-only.

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Questo articolo presenta un approccio basato sul deep learning che utilizza una rete neurale convoluzionale e un autoencoder denoising per segmentare con alta accuratezza la retina e rilevare i distacchi dell'epitelio pigmentoso in immagini OCT a basso costo destinate all'autosorveglianza domiciliare della degenerazione maculare legata all'età.

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Il paper propone il metodo ibrido 3D-PIUNet, che migliora la ricostruzione delle sorgenti cerebrali EEG integrando una stima iniziale basata sulla fisica con una rete neurale 3D U-Net per affinare la soluzione, ottenendo una maggiore accuratezza spaziale rispetto ai metodi tradizionali e puramente data-driven.

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Questo articolo propone un nuovo approccio per la fusione di immagini in pochi esempi che, sfruttando i "priors granulari" (incompleti) calcolati tramite l'algoritmo GBPC e un'adattiva funzione di perdita, permette a una rete neurale leggera di apprendere regole di fusione efficaci senza bisogno di immagini fuse reali come supervisione.

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

Il paper presenta PanSubNet, un framework di deep learning interpretabile che, analizzando direttamente le istologie standard H&E, predice i sottotipi molecolari clinicamente rilevanti del carcinoma pancreatico con alta accuratezza e valore prognostico, offrendo un'alternativa rapida ed economica ai costosi test genomici.

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

Il paper introduce GOUHFI 2.0, un nuovo toolbox di deep learning che, grazie a una strategia di randomizzazione del dominio e a due reti 3D U-Net addestrate su dati eterogenei, risolve le sfide della segmentazione cerebrale e della parcellizzazione corticale a risoluzione ultra-alta (UHF-MRI), offrendo per la prima volta una soluzione robusta e automatizzata per l'analisi volumetrica in questo contesto.

Marc-Antoine Fortin, Anne Louise Kristoffersen, Paal Erik GoaThu, 12 Ma⚡ eess

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

Il paper introduce ZACH-ViT, un Vision Transformer compatto per l'imaging medico che rimuove le codifiche posizionali e il token [CLS] per ottenere un'elaborazione permutazionale invariante, dimostrando prestazioni competitive in scenari con pochi dati e un vantaggio regime-dipendente che massimizza l'efficacia su dataset con layout spaziali meno informativi.

Athanasios AngelakisThu, 12 Ma⚡ eess

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

Il paper presenta ARCHE, un framework di compressione di immagini appreso end-to-end che, unificando prior gerarchici, spaziali e di canale senza ricorrere a componenti ricorrenti o transformer, raggiunge un'efficienza rate-distorsione all'avanguardia con un'ottima efficienza computazionale.

Sofia Iliopoulou, Dimitris Ampeliotis, Athanassios SkodrasThu, 12 Ma⚡ eess

An FPGA Implementation of Displacement Vector Search for Intra Pattern Copy in JPEG XS

Questo articolo presenta un'architettura FPGA pipeline ottimizzata per la ricerca del vettore di spostamento nello strumento Intra Pattern Copy di JPEG XS, che raggiunge una velocità di elaborazione di 38,3 Mpixels/s con un consumo di 277 mW, facilitando così l'implementazione hardware pratica di questa tecnica di compressione.

Qiyue Chen, Yao Li, Jie Tao, Song Chen, Li Li, Dong LiuThu, 12 Ma⚡ eess

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Questo articolo propone un sistema di trasmissione semantica adattivo per comunicazioni satellitari che, sfruttando un'architettura generativa multimodale e un modulo decisionale basato su modelli linguistici, garantisce una ricostruzione audiovisiva sincronizzata ad alta fedeltà riducendo il consumo di banda e migliorando la robustezza in condizioni di canale variabili.

Fangyu Liu, Peiwen Jiang, Wenjin Wang, Chao-Kai Wen, Xiao Li, Shi JinThu, 12 Ma⚡ eess

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

Il paper presenta DINR, un nuovo framework di inversione tomografica che combina rappresentazioni neurali implicite con un prior generativo basato su diffusione per ottenere ricostruzioni 3D ad alta qualità di dati di tomografia a neutroni da viste sparse, superando le limitazioni dei metodi tradizionali anche in condizioni di dati estremamente ridotti.

Maliha Hossain, Haley Duba-Sullivan, Amirkoushyar ZiabariThu, 12 Ma⚡ eess

An Efficient Self-supervised Seismic Data Reconstruction Method Based on Self-Consistency Learning

Questo studio propone un metodo di ricostruzione dei dati sismici basato sull'apprendimento auto-supervisionato e sulla coerenza interna, che utilizza una rete leggera priva di dataset esterni per ottenere ricostruzioni di alta qualità in condizioni di acquisizione irregolare.

Mingwei Wang, Junheng Peng, Yingtian Liu, Yong LiMon, 09 Ma🤖 cs.LG

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement

Il paper presenta ECLARE, un metodo di super-risoluzione efficiente e auto-apprendente che migliora la risoluzione anisotropa dei volumi MR clinici stimando il profilo della slice e apprendendo direttamente dai dati acquisiti, superando così le limitazioni delle tecniche esistenti senza subire problemi di spostamento di dominio.

Samuel W. Remedios, Shuwen Wei, Shuo Han, Jinwei Zhang, Aaron Carass, Kurt G. Schilling, Dzung L. Pham, Jerry L. Prince, Blake E. DeweyMon, 09 Ma💻 cs

← Precedente Successivo →