DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction
本文提出了首个用于稀疏视图 CBCT 重建的基础模型 DeepSparse,通过引入融合多视角 2D 与多尺度 3D 特征的 DiCE 网络架构,以及结合混合视角采样预训练和两阶段微调的 HyViP 框架,有效解决了现有方法计算需求高和泛化能力差的问题,显著提升了重建质量并降低了辐射风险。
90 篇论文
本文提出了首个用于稀疏视图 CBCT 重建的基础模型 DeepSparse,通过引入融合多视角 2D 与多尺度 3D 特征的 DiCE 网络架构,以及结合混合视角采样预训练和两阶段微调的 HyViP 框架,有效解决了现有方法计算需求高和泛化能力差的问题,显著提升了重建质量并降低了辐射风险。
本研究提出了一种引入方差惩罚机制的改进型金字塔 pix2pix 生成对抗网络,通过从常规 H&E 染色图像生成高保真 IHC 图像,有效解决了 HER2 阳性乳腺癌诊断中的模式崩溃问题,为精准肿瘤学提供了一种低成本、可扩展的 AI 驱动诊断新方案。
本文提出了一种结合自注意力机制与可解释性可视化的混合 TransUNet-GradCAM 模型,通过融合 Transformer 的全局上下文建模能力与 U-Net 的精细空间定位优势,在多个数据集上实现了具有强泛化能力和高临床相关性的糖尿病足溃疡自动分割。
该论文提出了一种名为 PANO 的物理感知神经算子,通过端到端直接学习从原始传感器测量到 3D 体积图像的逆映射,在无需重新训练的情况下实现了稀疏采样设置下的高质量、实时 3D 光声层析成像重建,显著优于传统算法并推动了该技术的临床转化。
本文提出了一种名为 UltraUPConvNet 的计算高效通用框架,该框架基于 UPerNet 和 ConvNeXt 架构,利用包含 9700 多个标注的大规模数据集,实现了在降低计算开销的同时,对超声图像进行组织分割与疾病预测的多任务联合处理。
CryoNet.Refine 是一种基于单步扩散模型的深度学习框架,它通过整合密度感知损失函数与立体化学约束,实现了比传统方法更快速、自动化且高质量的冷冻电镜结构模型优化。
本文提出了一种利用手机拍摄视频或图像并结合运动恢复结构(SfM)技术与三维分割算法,对现场骨料堆进行三维重建与单颗粒提取的创新方法,旨在为道路建设中的骨料粒径与形状分析提供便捷、低成本的现场质量管控解决方案。
该论文提出了一种利用真实音频驱动静态面部图像生成合成视频流的零资源框架,成功在缺乏标注数据的加泰罗尼亚语上实现了接近最先进水平的音视频语音识别性能,证明了合成视觉数据是替代真实录音的可行方案。
该论文首次提出利用深度学习方法(结合卷积神经网络与卷积去噪自编码器)对新型低成本全视野 OCT 设备获取的视网膜图像进行分割,实现了高精度的视网膜总层分割,并通过形状先验知识有效修正了因图像伪影导致的色素上皮脱离(PED)分割误差。
本文提出了一种名为 3D-PIUNet 的新型混合方法,通过结合物理逆解初始化与 3D 卷积 U-Net 的数据驱动优化,显著提升了脑电图(EEG)源定位的空间精度,并在模拟与真实视觉任务数据中验证了其优越性能。
该论文提出了一种基于“不完整先验”概念和粒球像素计算(GBPC)算法的少样本图像融合新方法,通过自适应损失函数使轻量级网络仅需少量图像对即可学习通用融合规则,在多个任务中实现了优异的视觉质量与模型紧凑性。
该研究提出了一种名为 PanSubNet 的可解释深度学习框架,能够直接从常规 H&E 染色病理切片中准确预测胰腺导管腺癌的临床相关分子亚型,从而克服了传统基因检测成本高、耗时长等局限,为精准医疗提供了快速且可部署的解决方案。
本文介绍了 GOUHFI 2.0,这是一个专为超高分辨率 MRI 设计的新一代深度学习工具箱,通过引入基于 238 名受试者数据的域随机化策略及双 3D U-Net 网络,实现了跨场强、跨对比度的鲁棒全脑分割、62 个皮层分区及体积测量,有效解决了现有工具在超高分辨率数据上表现不佳的难题。
该论文提出了 ZACH-ViT,一种移除位置编码和 [CLS] 标记的紧凑 Vision Transformer 架构,通过全局平均池化实现置换不变性,在医学影像的小样本场景下证明了根据数据空间结构特性调整归纳偏置(即在不同数据分布下表现出差异化的性能优势)比追求通用基准主导更为重要。
本文提出了名为 ARCHE 的端到端学习图像压缩框架,该框架通过统一分层、空间和通道先验并结合自适应特征重校准与残差细化技术,在不依赖循环或 Transformer 组件的情况下,以 95M 参数和每图 222ms 的运行时间实现了比 Balle 基准、Minnen & Singh 模型及 VVC 内帧编码更优的率失真性能。
本文提出了一种针对 JPEG XS 标准中帧内模式复制(IPC)位移向量搜索的高效流水线 FPGA 架构,通过优化存储组织实现了 38.3 Mpixels/s 的高吞吐量和低功耗,为其实用化部署及 ASIC 实现奠定了基础。
该论文提出了一种面向卫星场景的自适应多模态语义传输系统,通过双流生成架构动态切换音视频主导模式并结合大语言模型决策,在受限带宽下实现了高保真同步音视频重建。
本文提出了一种名为 Diffusive INR (DINR) 的框架,该框架利用在合成数据上预训练的生成扩散先验来正则化隐式神经表示(INR),从而在稀疏视角下实现了高质量的混凝土微观结构中子层析成像重建,显著优于现有的稀疏视图重建技术。
该论文提出了一种基于自一致性学习的轻量级自监督方法,无需额外数据集即可利用地震数据内部相关性实现高质量的不规则数据重建,有效解决了传统监督学习方法依赖外部数据及现有无监督方法约束不足的问题。
本文提出了 ECLARE 方法,这是一种无需外部训练数据的自超分辨率技术,通过利用从多切片 2D MR 体积中估计的切片轮廓和抗混叠机制,有效解决了临床成像中厚切片与层间间隙导致的各向异性分辨率问题,并在信号恢复及下游任务中优于现有方法。