Low-Rank and Sparse Drift Estimation for High-Dimensional Lévy-Driven Ornstein--Uhlenbeck Processes
本文针对具有低秩加稀疏结构的高维 Lévy 驱动 Ornstein-Uhlenbeck 过程,提出了一种基于核范数与 惩罚的凸估计量,并在特定正则性条件下推导了其非渐近 Oracle 不等式,证明了该方法能在保持离散化偏差的同时,通过利用结构特性显著改善估计风险对维度的依赖关系。
161 篇论文
本文针对具有低秩加稀疏结构的高维 Lévy 驱动 Ornstein-Uhlenbeck 过程,提出了一种基于核范数与 惩罚的凸估计量,并在特定正则性条件下推导了其非渐近 Oracle 不等式,证明了该方法能在保持离散化偏差的同时,通过利用结构特性显著改善估计风险对维度的依赖关系。
该论文通过数学证明和数值实验表明,无隐藏层的化学反应网络在分类任务(如手写数字识别)上比需要隐藏层的脉冲神经网络具有更高的学习效率和准确性,并提供了相应的理论界限分析。
该论文基于双模态混合抽象,从理论上量化了生成模型持续后训练中的遗忘现象,揭示了前向与反向 KL 散度在质量遗忘和旧分量漂移上的不同机制,并阐明了重放策略及现有近于策略方法如何受散度方向、几何重叠度及采样机制的影响。
本文通过引入源自几何图论的“稳定性”条件并结合分支过程理论,为具有战略互动和同群偏好的大型网络形成模型建立了中心极限定理,从而为基于单一大型网络观测数据的统计推断提供了理论依据。
本文提出了一种基于稳健损失函数的新型多分格相关系数估计量,该估计量无需对模型误设的类型或程度做假设,在保持与最大似然估计法相同计算成本的同时,能够有效抵抗因 careless respondents 等导致的模型部分误设,并在模拟与实证研究中展现出优异的稳健性与实用性。
本文证明了具有相同自由度的非中心威沙特分布混合仍服从非中心威沙特分布,并据此推导了多维正态数据下两因素析因设计模型中随机效应检验统计量的有限样本分布,从而将相关研究从一维情形推广至多维情形。
该论文通过建立伪似然估计量在单观测场景下的收敛速率,证明了在参数维度随样本量增加且存在边依赖的情况下,离散无向图模型(如引入重叠子群结构的广义模型)的可扩展估计是可行的,并揭示了相变和模型近退化对收敛速率的关键影响。
本文研究了基于具有空间依赖扩散系数且存在未知跳变点的加权拉普拉斯算子随机热方程的变点估计问题,通过构建基于局部空间测量的 M-估计量,证明了变点估计的收敛速率为、扩散系数估计速率为,并在扩散系数已知且跳变高度随分辨率趋于零时推导了变点估计量的极限分布。
本文研究了凸约束高斯序列模型中均方误差估计量(LSE)的极小极大最优性,通过刻画局部高斯宽度的行为给出了其最优性的充要条件(即局部高斯宽度映射的 Lipschitz 性质),并提供了理论算法及在多种几何结构(如球、金字塔和各向同性回归等)上的应用示例。
本文利用先进的矩阵集中不等式,通过更精确的谱范数分析消除了三种流行矩阵补全估计器收敛率中的维度因子,从而证明了其达到极小极大最优性。
本文研究了在存在任意比例异常值及高斯或次高斯噪声的对抗性污染环境下,受有界星形集合约束的鲁棒均值估计问题,推导出了基于局部熵的极小极大风险率,并进一步将结果推广至无界星形集合及噪声方差未知的场景。
本文提出了一种基于 Talagrand 泛链机制与单变量最优均值估计相结合的新型经验泛函,证明了在最小假设下,该泛函能以指数级高概率实现函数类均值估计的最优一致界,从而解决了高维概率与统计中的多个关键问题。
该论文提出了一种基于两阶段序贯抽样的估计方法,用于在任意参数下保证相对风险、优势比及其对数的均方误差低于目标值,同时使两总体平均样本量之比接近预设值,并具备高统计效率。
该论文针对独立观测数据,推导了样本最大值(离散情形)及近最大值(连续情形)数量的总变差距离显式误差界,分别利用对数分布、泊松分布和负二项分布作为近似,并通过发展对数分布的斯坦方法以及混合二项式的负二项近似理论,结合几何、Gumbel 和均匀分布等实例进行了阐述。
本文提出了一种基于贝叶斯模型选择的完全自动化的不规则直方图构建方法,该方法能根据数据自动确定分箱数量与位置,并在理论证明其具有 Hellinger 度量下的一致性及最优收敛速率的同时,通过模拟验证了其在估计误差和模式识别方面与其他方法相当的性能。
本文提出了一种基于神经主动流形非线性降维的方法,通过将高维输入空间映射至一维潜空间进行分层采样,从而有效解决了高维模型不确定性传播中的方差缩减难题。
该论文针对线性最小二乘模型提出了一种严谨的统计推断框架,通过推导精确的影响力公式并识别最大影响力的极值分布(弗雷歇分布或甘贝尔分布),实现了对异常高影响力数据子集的假设检验,从而取代了以往依赖启发式方法的做法。
本文提出了一种基于贝叶斯非参数先验的有限混合模型方法,通过建立分量分布的可识别性条件与后验收缩理论,并开发高效 MCMC 算法,实现了对复杂潜变量子总体分布的有效学习,其收敛速率显著优于传统去卷积方法。
该论文建立了算子学习的极小极大风险理论,证明了对于具有有限正则性的算子,无论假设其满足利普希茨条件还是赫尔德光滑性,在通用设定下均存在样本复杂度灾难,即极小极大风险无法随样本量呈代数级衰减。
本文提出了一种名为 Latent-IMH 的高效采样方法,通过利用计算廉价的近似算子生成潜在变量并结合精确算子进行修正,成功将计算成本转移至离线阶段,从而在贝叶斯线性逆问题中显著提升了采样效率并优于现有主流方法。