eess.IV 篇论文 | Gist.Science

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

本文提出了首个用于稀疏视图 CBCT 重建的基础模型 DeepSparse，通过引入融合多视角 2D 与多尺度 3D 特征的 DiCE 网络架构，以及结合混合视角采样预训练和两阶段微调的 HyViP 框架，有效解决了现有方法计算需求高和泛化能力差的问题，显著提升了重建质量并降低了辐射风险。

Yiqun Lin, Jixiang Chen, Hualiang Wang, Jiewen Yang, Jiarong Guo, Yi Zhang, Xiaomeng LiTue, 10 Ma💻 cs

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

本研究提出了一种引入方差惩罚机制的改进型金字塔 pix2pix 生成对抗网络，通过从常规 H&E 染色图像生成高保真 IHC 图像，有效解决了 HER2 阳性乳腺癌诊断中的模式崩溃问题，为精准肿瘤学提供了一种低成本、可扩展的 AI 驱动诊断新方案。

Sara Rehmat, Hafeez Ur Rehman, Byeong-Gwon Kang, Sarra Ayouni, Yunyoung NamTue, 10 Ma💻 cs

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

本文提出了一种结合自注意力机制与可解释性可视化的混合 TransUNet-GradCAM 模型，通过融合 Transformer 的全局上下文建模能力与 U-Net 的精细空间定位优势，在多个数据集上实现了具有强泛化能力和高临床相关性的糖尿病足溃疡自动分割。

Akwasi Asare, Mary Sagoe, Justice Williams Asare, Stephen Edward MooreTue, 10 Ma💻 cs

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

该论文提出了一种名为 PANO 的物理感知神经算子，通过端到端直接学习从原始传感器测量到 3D 体积图像的逆映射，在无需重新训练的情况下实现了稀疏采样设置下的高质量、实时 3D 光声层析成像重建，显著优于传统算法并推动了该技术的临床转化。

Jiayun Wang, Yousuf Aborahama, Arya Khokhar, Yang Zhang, Chuwei Wang, Karteekeya Sastry, Julius Berner, Yilin Luo, Boris Bonev, Zongyi Li, Kamyar Azizzadenesheli, Lihong V. Wang, Anima AnandkumarTue, 10 Ma🤖 cs.LG

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

本文提出了一种名为 UltraUPConvNet 的计算高效通用框架，该框架基于 UPerNet 和 ConvNeXt 架构，利用包含 9700 多个标注的大规模数据集，实现了在降低计算开销的同时，对超声图像进行组织分割与疾病预测的多任务联合处理。

Zhi Chen, Le ZhangTue, 10 Ma💻 cs

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

CryoNet.Refine 是一种基于单步扩散模型的深度学习框架，它通过整合密度感知损失函数与立体化学约束，实现了比传统方法更快速、自动化且高质量的冷冻电镜结构模型优化。

Fuyao Huang, Xiaozhu Yu, Kui Xu, Qiangfeng Cliff ZhangTue, 10 Ma💻 cs

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

本文提出了一种利用手机拍摄视频或图像并结合运动恢复结构（SfM）技术与三维分割算法，对现场骨料堆进行三维重建与单颗粒提取的创新方法，旨在为道路建设中的骨料粒径与形状分析提供便捷、低成本的现场质量管控解决方案。

Erol Tutumluer, Haohang Huang, Jiayi Luo, Issam Qamhia, John M. HartTue, 10 Ma💻 cs

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

该论文提出了一种利用真实音频驱动静态面部图像生成合成视频流的零资源框架，成功在缺乏标注数据的加泰罗尼亚语上实现了接近最先进水平的音视频语音识别性能，证明了合成视觉数据是替代真实录音的可行方案。

Pol Buitrago, Pol Gàlvez, Oriol Pareras, Javier HernandoTue, 10 Ma💬 cs.CL

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

该论文首次提出利用深度学习方法（结合卷积神经网络与卷积去噪自编码器）对新型低成本全视野 OCT 设备获取的视网膜图像进行分割，实现了高精度的视网膜总层分割，并通过形状先验知识有效修正了因图像伪影导致的色素上皮脱离（PED）分割误差。

Timo Kepp, Helge Sudkamp, Claus von der Burchard, Hendrik Schenke, Peter Koch, Gereon Hüttmann, Johann Roider, Mattias P. Heinrich, Heinz HandelsThu, 12 Ma⚡ eess

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

本文提出了一种名为 3D-PIUNet 的新型混合方法，通过结合物理逆解初始化与 3D 卷积 U-Net 的数据驱动优化，显著提升了脑电图（EEG）源定位的空间精度，并在模拟与真实视觉任务数据中验证了其优越性能。

Marco Morik, Ali Hashemi, Klaus-Robert Müller, Stefan Haufe, Shinichi NakajimaThu, 12 Ma⚡ eess

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

该论文提出了一种基于“不完整先验”概念和粒球像素计算（GBPC）算法的少样本图像融合新方法，通过自适应损失函数使轻量级网络仅需少量图像对即可学习通用融合规则，在多个任务中实现了优异的视觉质量与模型紧凑性。

Minjie Deng, Yan Wei, An Wu, Yuncan Ouyang, Hao Zhai, Qianyao PengThu, 12 Ma⚡ eess

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

该研究提出了一种名为 PanSubNet 的可解释深度学习框架，能够直接从常规 H&E 染色病理切片中准确预测胰腺导管腺癌的临床相关分子亚型，从而克服了传统基因检测成本高、耗时长等局限，为精准医疗提供了快速且可部署的解决方案。

Abdul Rehman Akbar, Alejandro Levya, Ashwini Esnakula, Elshad Hasanov, Anne Noonan, Lingbin Meng, Susan Tsai, Vaibhav Sahai, Midhun Malla, Sarbajit Mukherjee, Upender Manne, Anil Parwani, Wei Chen, Ashish Manne, Muhammad Khalid Khan NiaziThu, 12 Ma⚡ eess

eess.IV

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

Transforming H&E images into IHC: A Variance-Penalized GAN for Precision Oncology

TransUNet-GradCAM: A Hybrid Transformer-U-Net with Self-Attention and Explainable Visualizations for Foot Ulcer Segmentation

Physics-Aware Neural Operators for Direct Inversion in 3D Photoacoustic Tomography

UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction

CryoNet.Refine: A One-step Diffusion Model for Rapid Refinement of Structural Models with Cryo-EM Density Map Restraints

Three-dimensional reconstruction and segmentation of an aggregate stockpile for size and shape analyses

Bootstrapping Audiovisual Speech Recognition in Zero-AV-Resource Scenarios with Synthetic Visual Data

Segmentation of Retinal Low-Cost Optical Coherence Tomography Images using Deep Learning

Enhancing Brain Source Reconstruction by Initializing 3D Neural Networks with Physical Inverse Solutions

Rethinking Few-Shot Image Fusion: Granular Ball Priors Enable General-Purpose Deep Fusion

Inferring Clinically Relevant Molecular Subtypes of Pancreatic Cancer from Routine Histopathology Using Deep Learning

GOUHFI 2.0: A Next-Generation Toolbox for Brain Segmentation and Cortex Parcellation at Ultra-High Field MRI

ZACH-ViT: Regime-Dependent Inductive Bias in Compact Vision Transformers for Medical Imaging

ARCHE: Autoregressive Residual Compression with Hyperprior and Excitation

An FPGA Implementation of Displacement Vector Search for Intra Pattern Copy in JPEG XS

Semantic Satellite Communications for Synchronized Audiovisual Reconstruction

Regularizing INR with diffusion prior self-supervised 3D reconstruction of neutron computed tomography data

An Efficient Self-supervised Seismic Data Reconstruction Method Based on Self-Consistency Learning

ECLARE: Efficient cross-planar learning for anisotropic resolution enhancement