Post-Experiment Decisions: The Dual Adjustments for Rollout and Downstream Optimizations
该论文提出了一种名为 PATRO 的“预测 - 调整 - 再推广 - 优化”方法,通过对实验估计值进行独立的数据无关调整,解决了在不确定性下将实验结果同时用于推广决策和下游运营优化时因成本不对称而导致的次优问题,其效果在理论和数值上均接近贝叶斯最优基准。
252 篇论文
该论文提出了一种名为 PATRO 的“预测 - 调整 - 再推广 - 优化”方法,通过对实验估计值进行独立的数据无关调整,解决了在不确定性下将实验结果同时用于推广决策和下游运营优化时因成本不对称而导致的次优问题,其效果在理论和数值上均接近贝叶斯最优基准。
该论文在温和假设下建立了高维非退化 U 统计量的强高斯逼近理论,通过提出新的鞅极大不等式与高维独立和强逼近相结合的技术,实现了无需界或自助法即可推导泛函高斯极限,并成功应用于高维变化点检测与重尾分布下的自归一化检验。
该论文提出了一种针对高维函数时间序列的模型无关且分布自由的共形预测方法,通过比较拆分式与序列式共形预测在日本和加拿大分省年龄别死亡率数据上的表现,展示了其在有限样本下构建预测区间的优越性。
这篇方法学综述评估了 2024 年发表的诊断准确性 Meta 分析中异质性研究的频率、特征及与指南的一致性,发现异质性研究虽普遍存在且与研究数量正相关,但统计模型报告常不清晰,且预先方案中的异质性研究预设不足。
本文针对将肯德尔 3D 形状空间理论转化为实际计算流程的难题,提出了一套基于 Python 的几何工具,旨在弥补现有库(如 Geomstats)在高级 3D 形状分析方面的功能缺失,从而为研究人员提供高效且易于使用的软件解决方案。
该论文通过对比蒙特卡洛 Dropout 与共形预测两种方法在 Fashion-MNIST 数据集上的表现,指出尽管 H-CNN VGG16 精度更高但存在过度自信问题,而 GoogLeNet 校准性更优且共形预测能提供统计保证的预测集,从而强调了在深度学习系统中超越准确率、重视可靠性与不确定性评估的重要性。
本文提出了一种名为 PCID 的基于置换检验的隔离检测新方法,用于在离线模式下有效检测分段常数圆形信号中的多个变点,该方法在假设噪声服从冯·米塞斯分布下推导对比函数,并展现出对多种分布及序列相关噪声的鲁棒性,且在多个真实世界数据集上得到了验证。
ReTabSyn 是一种基于强化学习的表格数据合成框架,它通过优化条件分布 而非全联合分布,在小样本、类别不平衡及分布偏移等场景下显著提升了合成数据的下游任务效用。
该论文针对精准医疗中异质性效应估计的需求,提出了一种基于协变量分布拟合度对外部数据进行个体加权、并结合贝叶斯先验进行试验设计的部分信息借用框架,旨在优化稀疏亚组的临床试验效能。
该论文提出并实现了一种数据分析的正式表示方法,旨在通过外化其逻辑构建过程来揭示分析师的推理、假设和前提,从而在不依赖原始数据的情况下评估分析质量、可视化逻辑联系并检验假设的敏感性。
该论文详细阐述并扩展了 Weedon-Fekjær 等人提出的风险时间分割法,通过利用最大似然估计和所有可用数据来修正癌症筛查对后期死亡率的影响,从而在挪威和丹麦数据的实证分析中显著提高了估计精度并缩小了置信区间。
本文提出了一种基于核函数(包括核 Stein 差异和最大均值差异)的新颖等价性检验方法,旨在克服传统拟合优度检验无法有效证明分布间无显著差异的局限,通过设定预定义差异边界并采用渐近正态近似或自举法计算临界值,从而在控制误差率的前提下评估候选分布与名义分布的等价性。
本文通过模拟研究阐述了在 ICH E9(R1) 框架下,非劣效性试验中非劣效界值的选择必须反映目标估计量(estimand),并指出由于历史试验与当前试验在估计量定义或处理中断事件策略上的差异,可能导致基于历史证据推导的界值存在挑战。
该论文提出了一种基于 Kullback-Leibler 散度惩罚的异质性自适应元分析框架,通过向新的“质心”分布收缩来动态调整数据集间的信息共享,从而在不假设参数同质性的前提下实现了比传统方法更小的均方误差和有效的统计推断。
本文提出了一种基于校准吉布斯后验的非参数方法,通过利用非对称拉普拉斯损失函数并校准学习率,在无需参数假设的情况下构建出兼具可靠覆盖率与更短区间长度的贝叶斯容忍区间。
该论文提出了一种基于核密度估计(KDE)的实用方法,通过建模合成数据与训练记录间的最近邻距离分布,在不依赖计算密集型影子模型的情况下,有效量化了表格合成数据中的成员披露风险,并实现了比现有基线更优的风险评估效果。
本文通过证明偏 Copula 是偏相关系数的非线性类比,并揭示条件 Copula 的依赖属性如何约束偏 Copula 的形式,展示了其在去除协变量影响后刻画统计依赖关系及辅助因果推断方面的潜力。
该论文针对质谱分子结构识别中的高误报风险,提出了一种基于风险 - 覆盖率权衡的筛选预测框架,通过评估不同不确定性量化策略,证明利用计算成本较低的一阶置信度及检索级偶然不确定性,结合分布外风险控制方法,可在保证高概率满足预设错误率约束的前提下,有效筛选出可信的分子结构注释。
该论文正式化了测试时扩展下的密集基准排名问题,推出了开源库 Scorio 以实施多种统计排名方法,并通过在多个数学基准上的实验验证了这些方法在不同预算下对贝叶斯金标准的可靠性。
该论文针对平台试验中的非并发对照组问题,建立了一个以并发人群为目标的因果生存分析框架,并通过实证与理论分析表明,相较于盲目合并非并发数据,仅使用并发对照并结合协变量调整的双重稳健估计法,是提升精度且避免偏差的最稳健策略。