Asymptotics of cut distributions and robust modular inference using Posterior Bootstrap
本文从渐近角度研究了用于阻断错误模型信息传播的截断分布,推导了 Bernstein-von Mises 定理和带有定量界限的拉普拉斯近似,并提出了一种基于后验 Bootstrap 的算法,使其生成的可信区间具备名义上的频率渐近覆盖率。
252 篇论文
本文从渐近角度研究了用于阻断错误模型信息传播的截断分布,推导了 Bernstein-von Mises 定理和带有定量界限的拉普拉斯近似,并提出了一种基于后验 Bootstrap 的算法,使其生成的可信区间具备名义上的频率渐近覆盖率。
本文旨在为离散观测的随机粗糙微分方程建立统计推断框架,通过定义连续逆问题并构建基于离散逆问题序列收敛的几何-粗糙路径解,提出了一种利用路径签名表示的迭代数值算法,证明了该算法在-变差拓扑下对局部梯度的同步更新具有关于观测步长的一致收敛性。
该论文提出了一种基于凸松弛和分支定界的新框架,将低秩矩阵补全问题转化为可证明最优解的凸优化问题,从而在显著缩小最优性间隙的同时,大幅降低了测试集误差。
该论文提出了一种基于最优传输的分布式混合专家模型聚合框架,通过最小化传输散度将本地模型高效整合为全局估计器,仅需单次通信即可在保持模型结构的同时实现媲美集中式训练的性能并显著降低计算成本。
本文针对具有当前状态数据的渐进多状态模型,提出了两种基于竞争风险概念的无参数估计方法,用于在严重区间删失导致风险集计数缺失的情况下估计状态进入时间分布及状态占用概率,并通过模拟研究和乳腺癌数据应用验证了其有效性。
本文针对截尾生存数据,提出了两种分别以截断平均生存时间和缓冲生存概率为目标的鲁棒治疗规则学习准则,开发了基于采样的差凸算法并进行了理论与实证验证。
本文研究了利用大量低精度数据辅助高精度数据进行参数估计的多保真度方法,提出了联合最大似然、多保真度矩估计及边际最大似然三种策略,并将其应用于极值分析模型及极端船舶运动模拟的量化中。
该论文提出了一种几何记忆理论,揭示扩散模型在训练数据稀缺时会经历从泛化到精确复制的平滑过渡,其过程表现为特征按显著性顺序逐步“冻结”,最终导致模型坍缩至少数低能态配置。
本文系统研究了 Vecchia 高斯过程近似在概率与统计层面的性质,通过提出基于范数集的选择策略并揭示其与多项式插值的联系,证明了该近似在非参数回归模型中能达到最优极小极大后验收缩率,并辅以数值实验验证。
本文通过理论推导与模拟实验,揭示了小区域经验最佳线性预测区间覆盖误差的阶数取决于枢轴量的存在性,并首次提出利用双重参数自助法在缺乏枢轴量时修正覆盖误差,从而将误差阶数从提升至。
本文提出了一种名为 CLIQUE 的新颖模型无关方法,通过量化期望来捕捉局部依赖关系,从而克服了 LIME 和 SHAP 等现有方法在反映局部变量交互及多分类问题上的局限性,并有效降低了预测偏差。
该论文通过建立临床试验设计统计特性与临床均势失衡之间的形式化联系,提出了一种“均势校准”方法,证明常规设计的统计功效与假阳性率足以在阳性结果下提供强有力的均势失衡证据,从而为定义稳健的临床试验设计提供了操作化标准。
本文提出了一种不依赖随机传递性假设的广义成对比较统计模型,该模型利用低维斜对称矩阵刻画比较概率,并开发了具备稀疏数据适应性与极小化极大最优性的估计方法,从而在理论与实证上显著超越了传统的 Bradley-Terry 等模型。
该论文提出了一种利用 Cholesky 分解将类内协方差纳入优化问题的算法,以解决传统支持向量机在非欧几里得空间中的次优性问题,并通过实验证明该协方差调整模型在多项性能指标上显著优于传统 SVM 及白化算法。
本文提出了一种名为 NETCROP 的通用网络交叉验证方法,通过利用重叠子网划分构建训练与测试集,实现了在大规模网络模型选择与参数调优任务中兼具计算高效性与高准确性的解决方案。
本文提出了一种基于离线数据的创新算法,通过构建高阶马尔可夫决策过程并结合生存分析技术,有效解决了在需求具有依赖性和 censoring(截断)特性的动态库存与定价问题,从而估计出最大化长期利润的最优策略。
本文提出了一种自适应算法,通过平衡多保真度统计估计中用于计算最优分配所需的“神谕”统计量估算与最终估计器构建之间的资源,在忽略传统方法中常忽视的估算成本与误差的情况下,实现了与理想最优分配相当的平均平方误差性能。
该论文指出传统荟萃分析在非线性效应量下缺乏因果解释,因此提出了无需个体数据的新型因果聚合公式,并通过对 500 项已发表研究的实证分析,揭示了传统方法可能将有害治疗误判为有益的风险。
本文针对自适应干预中缺乏实证选择“定制变量”(包括测量时机、决策时机及截断值)指导的问题,提出了一套系统框架,并论证了虽然可利用二次观测数据,但通过专门设计的优化随机对照试验能提供更直接因果证据来构建基于证据的定制变量。
该论文提出了一种基于加法树模型和新型平衡损失函数的两样本密度比估计方法,该方法不仅支持高效的监督学习算法和广义贝叶斯推断以实现不确定性量化,还在数值实验中展现出高精度与计算效率,并成功应用于微生物组生成模型的质量评估。