The Volterra signature
本文提出了一种名为 Volterra 签名()的显式特征表示方法,通过引入时间核函数将输入路径展开至张量代数,不仅建立了包含可识别性、通用近似定理及核技巧在内的严格学习理论保证,还利用线性状态空间方程和重参数化不变性实现了高效计算,从而在动态学习任务中显著优于传统的路径签名基线。
335 篇论文
本文提出了一种名为 Volterra 签名()的显式特征表示方法,通过引入时间核函数将输入路径展开至张量代数,不仅建立了包含可识别性、通用近似定理及核技巧在内的严格学习理论保证,还利用线性状态空间方程和重参数化不变性实现了高效计算,从而在动态学习任务中显著优于传统的路径签名基线。
本文提出了一种在混合在线学习设置下兼具统计最优性与计算效率的算法,该算法在约束对手标签生成机制的前提下,利用 ERM 预言机实现了基于 Rademacher 复杂度的遗憾界,并进一步应用于高维动作集下的随机零和博弈均衡计算。
本文通过变分和梯度分析,严格证明了经典 K-Means 算法与具有平滑责任机制的可微径向基函数(RBF)神经网络之间的等价性,并引入 Entmax-1.5 解决低温数值不稳定问题,从而实现了将 K-Means 无缝嵌入深度学习架构以进行端到端联合优化。
本文提出了一种利用辅助预测信息来增强分布独立性检验的框架,该框架在确保最坏情况下有效性的同时,能够根据预测质量自适应地降低样本复杂度,并证明了其样本复杂度的最优性。
本文提出了一种名为 sFRC 的新方法,即通过在深度学习医学图像恢复输出的小补丁上执行傅里叶环相关分析并扫描其与参考图像的对应关系,以有效检测并量化由欠采样数据引起的幻觉伪影,从而评估不同重建方法的鲁棒性。
该论文提出“预测性遗忘”假说,认为大脑通过离线巩固过程选择性地保留能预测未来结果的信息,从而在压缩存储复杂度的同时优化泛化能力,解决了传统记忆巩固理论难以解释的表征漂移和语义化等问题。
该论文针对线性非高斯潜在变量循环因果模型,首次提出了无结构假设下的分布等价性图判据与等价类遍历算法,从而实现了无需特定结构约束的因果发现。
该论文证明了卷积神经网络中的局部性和权重共享机制通过将滤波器耦合至低维补丁流形,有效克服了全连接网络在高维球面数据上过拟合的局限,从而显著提升了模型的泛化能力。
本文通过新颖的原始 - 对偶分析,证明了在高维随机特征下,梯度下降训练浅层 ReLU 模型时的隐式偏差以高概率逼近最小 L2 范数解,且两者之间的差距为 。
该论文通过方向平滑性视角将“边缘稳定性”现象推广至非欧几里得梯度下降,提出了一种适用于任意范数(包括、块坐标下降等)的广义锐度度量,并实验验证了各类优化器在训练过程中均表现出先渐进锐化后在$2/\eta$阈值附近震荡的稳定性特征。
本文提出了 fedCI 及其扩展算法 fedCI-IOD,通过联邦学习框架在保护隐私的前提下,实现了跨异构数据集(含不同变量集、特定站点效应及混合变量类型)且存在潜在混杂因素的高效因果发现。
本文提出了一种名为“系数变异序贯阈值”(STCV)的新型稀疏回归算法,通过引入无量纲的统计指标替代传统的幅度阈值,有效解决了数据归一化对稀疏动力学识别(SINDy)造成的扭曲问题,从而在含噪及归一化数据中实现了更鲁棒、准确的物理定律发现。
本文提出了一种将人口统计公平性(DP)和条件人口统计公平性(CDP)约束纳入个性化决策规则估计的新框架,通过扰动无约束最优规则实现高效求解,并从理论收敛性、模拟实验及俄勒冈州健康保险实验实证中验证了该方法在平衡决策效用与公平性方面的有效性。
该论文通过广泛实验发现,预训练与下游数据间的分布偏移是导致 ViT 深层性能下降的主因,并进一步提出在分布偏移较大时探测前馈网络激活、在偏移较小时探测归一化多头自注意力输出,能实现最优的分布外探测效果。
本文提出了一种以处理效应为导向的贝叶斯监督因果聚类(BSCC)方法,旨在识别在协变量特征和治疗效应上均具有同质性的患者亚组,并通过模拟数据及真实世界卒中试验数据验证了其在个性化决策中的实用性。
该论文针对临床预测中评估高维基因组特征重要性时传统方法忽略共线性和依赖方向性的问题,提出利用非对称沙普利值作为更诚实的度量指标,推导了高效的局部与全局计算算法,并通过结直肠癌无进展生存期预测实例验证了其在推断和性能分解方面的有效性。
该论文证明了预测推断中存在四种互不嵌套的容许性几何结构(Blackwell 风险主导、任意时刻有效、边际覆盖有效性及 Cesàro 可接近性),揭示了不同优化准则下最优性的独特证书及其几何不相容性,从而论证了容许性本质上是相对于特定准则的。
本文建立了经验风险最小化决策树在高维回归与分类中的统计理论,通过引入基于经验局部 Rademacher 复杂度的新型均匀集中不等式框架,证明了其在刻画可解释性与精度权衡方面的最优性,并针对包含稀疏性、各向异性平滑及空间异质性的分段稀疏异质各向异性 Besov 空间推导出了极小极大最优收敛率。
本文从统计学视角综述了生成式人工智能合成数据的现状,深入探讨了其适用假设、潜在局限与常见陷阱,并提出了确保合成数据在下游发现、推断和预测中得以原则性、可靠使用的框架与实用建议。
本文提出了一种基于后验退火的统一热力学响应框架,将奇异学习理论中的关键量(如真实对数规范阈值和奇异波动)与 WAIC、WBIC 等贝叶斯准则联系起来,从而为理解奇异模型中的复杂性、预测变异性及结构重组提供了自然的物理解释。