Geodesic slice sampling on the sphere
本文提出了一种针对球面上概率分布的高效无调参测地线切片采样算法,并通过理论证明与数值实验表明,该方法在混合性及复杂目标分布(如刚体配准问题)上的采样性能优于随机游走 Metropolis-Hastings 和哈密顿蒙特卡洛等标准采样器。
154 篇论文
本文提出了一种针对球面上概率分布的高效无调参测地线切片采样算法,并通过理论证明与数值实验表明,该方法在混合性及复杂目标分布(如刚体配准问题)上的采样性能优于随机游走 Metropolis-Hastings 和哈密顿蒙特卡洛等标准采样器。
本文通过建立高维下自助法覆盖概率的渐近展开公式,解释了为何在特定条件下三阶矩匹配的野自助法无需学生化即可实现二阶精度,并证明了双野自助法在任意协方差结构下均具有二阶精度。
本文从分布稳定性角度研究了稀疏精度矩阵估计器,推导了其在真实数据与“污染”数据分布差异下的显式局部 Lipschitz 界,并给出了协方差矩阵及其特征值估计的类似结果。
本文提出了一种名为自适应迁移聚类(ATC)的统一框架,该算法通过优化偏差 - 方差分解,能够在主数据集与辅助数据集存在未知差异的情况下自动利用共性,从而在包括高斯混合模型在内的多种统计模型中实现最优的聚类效果并量化迁移收益。
本文提出了一种名为 DR-FoS 的新方法,用于在观测研究中估计具有双重稳健性的函数平均处理效应(FATE),该方法在结果或处理分配模型之一设定错误时仍能保持一致性估计,并证明了其收敛于高斯过程以实现全域有效推断,同时通过模拟和 SHARE 数据集实证验证了其优越性能。
本文提出了一种新算法,利用参考族的森林结构特性,将计算递增假设路径上假发现比例后验界的时间复杂度从降低至,从而实现了对整条曲线的高效快速计算。
本文基于 Kojevnikov 等人(2021)的研究,通过构建适用于网络依赖数据的新颖一致大数定律,确立了广义矩估计(GMM)和 M 估计量的一致性与渐近正态性,并提供了完整的估计与推断程序。
本文提出了一种利用样本间关系进行低秩泊松张量分解的泊松张量补全(PTC)估计器,通过将直方图分箱识别为非均匀泊松过程来实现对均值测度的补全,从而在无需额外非负约束的情况下,显著优于针对次高斯分布的标准直方图估计器。
本文介绍了一种名为 c-delta 的自定义统计系数,旨在通过量化两组数据内部发散模式的相似性(而非传统的相关性),为量子物理、遗传学及机器学习等领域提供一种评估变异结构相似性的新视角。
本文提出了名为 Sigmoid-FTRL 的自适应实验设计方法,通过同时最小化两个凸 regret 来解决 AIPW 估计器在基于设计的设定下非凸优化的挑战,证明了其 Neyman 遗憾达到 的极小极大最优收敛速率,并建立了相应的中心极限定理与方差估计器以支持渐近有效的置信区间构建。
本文建立了一个基于非标准分析的相干风险度量框架,通过超有限表示和离散 Kusuoka 公式,将相干风险度量实现为 Loeb 概率空间上内部支撑泛函的标准部分,并推导了相干风险估计量的鲁棒表示、一致收敛性、自举有效性及渐近正态性等核心统计性质。
本文提出了一种新型协变量自适应随机化方法,该方法在确保指定协变量达到 收敛速度的同时,保证未指定协变量的渐近偏倚方差不超过简单随机化,从而避免了方差膨胀及 Liu 等人(2025)发现的“偏移问题”。
该论文通过引入随机排列并应用全方差定律,将移动极差估计量的方差精确分解为与顺序无关的数值分量(基于样本基尼平均差)和与顺序相关的相邻分量,从而在正态分布假设下揭示了其相对于样本标准差估计量的效率损失主要源于相邻效应。
本文提出了一种可扩展的多任务高斯过程模型,通过引入完全可分离核结构来联合处理函数型协变量与多任务相关性,利用克罗内克积结构实现高效计算,并在铆接装配等复杂机械系统中以少量样本实现了优于单任务模型的精准预测与不确定性量化。
该论文构建了一个将样本量与参数方差作为状态变量、香农信息类比为熵的热力学框架,用于描述渐近推断过程,揭示了包括逆第二定律循环不等式、受噪声限制的第三定律式下界以及高斯极限下德布鲁因恒等式与 I-MMSE 关系在内的统一结构,表明系综物理与推断物理是同一热力学描述中方向相反的影子过程。
本文针对漂移系数依赖类别且扩散系数共用的时间齐次随机微分方程路径,在低噪声条件下通过建立指数不等式,证明了二元插值分类器在赫尔德空间上的最小最大收敛速率快于现有结果,并推导了经验分类器超额风险的下界。
本文提出了 RACER 方法,通过将大语言模型路由问题建模为-VOR 问题并利用有限样本浓度界限进行校准,实现了在无需分布假设的情况下对误路由风险的控制,从而在降低成本的同時显著提升了下游任务的准确性。
本文提出了一种基于最大熵原理和 k 近邻估计器的新 Kullback-Leibler 散度估计量,用于构建多元连续分布的正态性检验统计量,蒙特卡洛模拟表明该方法在控制第一类错误率的同时,在中等至高维场景下比传统检验具有更优的统计功效。
本文在自适应多臂老虎机框架下,针对在线平台等场景中“证明至少存在一个干预对特定子群产生正向效应”的目标,提出了两种推断程序(包括基于适度偏差原理的时序均匀多重检验方法),并将实验设计转化为以信噪比为奖励的带优化问题,从而实现了在完全自适应采样下的有效统计推断与算法设计。
本文提出了一种基于非高斯传输度量的弗雷歇回归新方法,通过将多元分布响应分解为边缘分布与依赖结构的独立回归,有效解决了高维分布数据回归中的计算与统计挑战,并证明了其理论收敛性。