Generic Camera Calibration using Blurry Images
该论文提出了一种利用几何约束和局部参数化光照模型,在通用相机标定中同时估计特征点位置与空间变化点扩散函数并解决平移模糊问题的方法,从而有效应对因需大量图像而难以避免的运动模糊挑战。
93 篇论文
该论文提出了一种利用几何约束和局部参数化光照模型,在通用相机标定中同时估计特征点位置与空间变化点扩散函数并解决平移模糊问题的方法,从而有效应对因需大量图像而难以避免的运动模糊挑战。
本文提出了一种利用多体积潜在一致性模型进行有限角 CT 重建的方法,通过引入多尺度潜在表示作为引导,在显著不同视野和投影角度条件下实现了快速、稳定且高精度的三维结构恢复与边界细节保持。
该论文提出了一种基于 Nanopore 测序仪自适应采样技术的 DNA 图像存储方案,利用 JPEG2000 的渐进式解码功能,通过按需选择并测序特定寡核苷酸池来实现无需 PCR 的随机访问,从而显著降低检索低分辨率图像的成本。
本文提出了名为 ICHOR 的自监督预训练方法,利用基于 3D 掩码自编码器的视觉 Transformer 在大规模多中心 ASL CBF 数据集上进行训练,显著提升了在多种下游诊断分类及图像质量预测任务中的表现,有效克服了 ASL 成像中数据标注稀缺和跨站点差异带来的挑战。
本文提出了名为 GeoTop 的数学原理框架,通过融合拓扑数据分析与 Lipschitz-Killing 曲率,有效解决了诊断影像中良恶性结构拓扑等价但几何细节不同的难题,在皮肤病变分类等任务中显著提升了准确率并降低了误诊率,同时兼具可解释性与高效性。
本文提出了 Implicit U-KAN 2.0,一种结合二阶神经微分方程(SONO)与 MultiKAN 层的新型隐式 U-Net 架构,旨在通过增强理论可解释性、摆脱输入维度对近似能力的限制,在降低计算成本的同时显著提升医学图像分割的性能。
本文提出了一种名为 CSASN 的新型多任务学习框架,通过融合 EfficientNet 与 ViT 的双分支注意力机制及动态加权损失函数,有效解决了甲状腺罕见癌超声影像中特征异质性与数据不平衡的难题,显著提升了分类精度与稳定性。
本文深入表征了 iPhone 人像模式下特有的合成散焦噪声模式(SDNP),提出了其精确估计方法,并展示了该模式在跨设备版本溯源及通过掩蔽受干扰区域显著提升 PRNU 相机来源验证准确性方面的关键应用价值。
本文提出了一种名为快速等变成像(FEI)的新型无监督学习框架,该方法通过结合拉格朗日乘子法与即插即用去噪器,在无需真实标签数据的情况下,实现了比传统等变成像快约 10 倍的训练速度,并显著提升了 X 射线 CT 重建和图像修复等任务的性能及泛化能力。
该论文提出了一种名为“持久同调卷积”的新方法,通过在卷积操作中引入局部持久同调信息来弥补传统卷积神经网络在组织病理学图像分类中丢失拓扑特征的缺陷,实验表明该方法不仅提升了诊断性能,还降低了对超参数的敏感性。
本文针对 embodied intelligence 中动作提示视频分割面临的标注噪声问题,首次构建了 ActiSeg-NL 基准,系统评估了多种噪声学习策略,并提出了并行掩码头机制(PMHM)以有效应对文本和掩码标注噪声。
本文提出了 Cryo-SWAN,这是一种受多尺度小波分解启发的体素变分自编码器,旨在通过条件粗到细的潜在编码和递归残差量化,实现对分子密度体积中全局几何与高频细节的精准表征,从而推动结构生物学和体积成像领域的 AI 应用。
该论文针对传统骨料表征方法的局限性,提出了一套涵盖单颗粒、二维堆场及三维点云场景的现场成像框架,通过开发集成重建 - 分割 - 补全(RSC-3D)的深度学习算法,实现了对骨料形态特征的高效自动化分析与未可见面的预测。